SEO-Tối ưu hóa công cụ tìm kiếm
Bách khoa toàn thư mở Wikipedia
Đừng nhầm lẫn với CEO.
Tối ưu hóa công cụ tìm kiếm, tiếng Anh: Search Engine Optimization, viết tắt: SEO, là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một website trong các trang kết quả của các công cụ tìm kiếm (phổ biến nhất là Google).[1] Các phương pháp đó bao gồm việc tối ưu hóa website ( tác động mã nguồn HTML và nội dung website) và xây dựng các liên kết đến trang để các công cụ tìm kiếm chọn lựa trang web phù hợp nhất phục vụ người tìm kiếm trên Internet ứng với một từ khóa cụ thể được người dùng truy vấn.Mục lục |
Các ưu điểm
SEO mang lại một số ưu điểm: [2][3]- SEO mang lại lợi nhuận.
- SEO giúp thu hút lượng lớn khách hàng mục tiêu có quan tâm trực tiếp đến sản phẩm, dịch vụ kinh doanh của công ty. Vì vậy mang lại doanh thu.
- Tiết kiệm chi phí truyền thông khác.
- Chi phí dành cho SEO không lớn.
- Giúp doanh nghiệp mở rộng thị trường, đối tượng khách hàng, thậm chí đa dạng hóa sản phẩm một cách dễ dàng.
- SEO nâng cao thương hiệu của doanh nghiệp.
- Xuất hiện nhiều trên kết quả tìm kiếm khiến doanh nghiệp của bạn dễ dàng được biết đến.
- Xuất hiện ở những vị trí cao hàm ý doanh nghiệp của bạn hoạt động lâu năm và là website đáng tin cậy.
Các lĩnh vực SEO
Trước hết cần khẳng định, làm SEO mang nhiều yếu tố về mặt kỹ thuật, sẽ rất khó nếu không hiểu về việc xây dựng website. SEO có thể chia làm 2 mảng chính:- Seo Onpage: tối ưu thiết kế và nội dung website.
- Seo Offpage: xây dựng liên kết từ website khác trỏ tới website của bạn.
Phương pháp tối ưu hóa
Google, Yahoo hay Bing là các bộ máy tìm kiếm vì thế nó xây dựng các tiêu chuẩn để đánh giá, xếp hạng website. Một website càng đáp ứng được nhiều các tiêu chuẩn của máy tìm kiếm thì càng được đánh giá tốt, cơ hội lên trên TOP sẽ cao hơn. Hiện nay, có một số cách thức quan trọng sau để thực hiện SEO: [4]- Title - Tiêu đề trang: khai báo thẻ Page Title của website ngắn gọn, súc tích, duy nhất trong từng webpage. Các máy tìm kiếm đánh giá rất cao thẻ Page Title do nó là những gì xúc tích, hàm chứa nhất của website.
- Description- Thẻ mô tả: Nó giống như một đoạn tóm tắt nội dung của website. Khi khai báo Description cũng phải viết ngắn gọn, xúc tích. Desciption thông thường là đoạn text màu đen hiện ra bên trên đường link, bên dưới tiêu đề trang trong phần kết quả tìm kiếm.
- URL: Xây dựng một URL tĩnh - hay URL thân thiện với người dùng và máy tìm kiếm. Trong URL thân thiện không nên có các ký tự đặc biệt (%, $, ~, ...) mà phải giống như đường dẫn thư mục trong window. Việc này làm các công cụ tìm kiếm dễ dàng hơn trong việc tìm và thu thập nội dung trong website.
- Xây dựng Backlink: Là việc trao đổi liên kết, xây dựng liên kết tới các website khác. Việc trao đổi này dựa trên trao đổi với các website có cùng nội dung chủ đề và chất lượng tốt thì sẽ có hiệu quả cao hơn.
- Với SEO nội dung là điều kiện quan trọng nhất để SEO một website. Nội dung của website phải hữu ích với độc giả. Máy tìm kiếm sinh ra là để phục vụ mọi người tìm kiếm thông tin trên Internet. Những Website có được nội dung phong phú, hữu ích và thông tin luôn cập nhật sẽ luôn nằm ở vị trí TOP đầu.
http://vi.wikipedia.org/wiki/T%E1%BB%91i_%C6%B0u_h%C3%B3a_c%C3%B4ng_c%E1%BB%A5_t%C3%ACm_ki%E1%BA%BFm
Tự học SEO với giáo trình SEO VietMoz
Đăng lúc: Chủ nhật - 16/09/2012 11:52 - Người đăng bài viết: Lê Nam
Tài liệu học SEO theo giáo trình SEO cơ bản của VietMoz bằng
tiếng Việt giúp các bạn đam mê SEO có thể tự học SEO và làm SEO. Chỉ
với 30 phút mỗi ngày hoặc bạn có thể dành 12 tiếng học liên tục để nắm
bắt được cách thức tối ưu website thân thiện với Google, từ đó giúp nâng
hạng website trên bảng xếp hạng tìm kiếm.
Chào mừng bạn đến với giáo trình tự học SEO cở bản của VietMoz
Giáo trình này được nhóm tác giả VietMoz biên soạn nhằm mục đích hỗ trợ cho các bạn đam mê SEO và muốn tự học SEO,
mình thiết nghĩ nó rất hữu ích cho các webmaster – những người mong
muốn cải thiện thứ hạng của trang web trên công cụ tìm kiếm. Dù giáo
trình không tiết lộ cho bạn bí quyết nào giúp tự động nâng hạng website
lên vị trí #1 trên Google, nhưng nếu bạn áp dụng các thủ thuật cơ bản
nhất được trình bày đại cương bên dưới, mình tin rằng bạn hoàn toàn có
thể tối ưu website thân thiện với Google, và nhờ đó Google sẽ xếp hạng
website bạn cao hơn.
Giáo trình SEO này có thể áp dụng cho bất kỳ Website nào, không phân biệt lớn nhỏ, không phân biệt lĩnh vực. Chỉ cần bỏ ra 30 phút mỗi ngày hoặc liên tục trong 12 tiếng để nghiên cứu hết bộ giáo trình SEO cơ bản này, bạn hoàn toàn có thể tự tay đưa trang web lên TOP 10 Google. Hy vọng giáo trình này sẽ mang đến cho bạn những ý tưởng mới mẻ giúp cải thiện chất lượng web. Mình luôn sẵn sàng đón nhận mọi câu hỏi, ý kiến phản hồi cùng những câu chuyện thành công của các bạn sau khi học hết giáo trình.
Giáo trình SEO này có thể áp dụng cho bất kỳ Website nào, không phân biệt lớn nhỏ, không phân biệt lĩnh vực. Chỉ cần bỏ ra 30 phút mỗi ngày hoặc liên tục trong 12 tiếng để nghiên cứu hết bộ giáo trình SEO cơ bản này, bạn hoàn toàn có thể tự tay đưa trang web lên TOP 10 Google. Hy vọng giáo trình này sẽ mang đến cho bạn những ý tưởng mới mẻ giúp cải thiện chất lượng web. Mình luôn sẵn sàng đón nhận mọi câu hỏi, ý kiến phản hồi cùng những câu chuyện thành công của các bạn sau khi học hết giáo trình.
MỤC LỤC GIÁO TRÌNH TỰ HỌC SEO
SEO là gì
Các yếu tố trong Onpage
Thẻ tiêu đề (Title)
Thẻ miêu tả (Meta description)
Nội dung trùng lặp - Duplicate Content
Liên kết nội bộ - Internal links
Neo văn bản - Anchor text
Liên kết ngoài - External links
Robots.txt
URL
Tên miền - Domain
Canonical
Redirection
Mã trạng thái HTTP
Domain Authority
Page Authority
Tối ưu ấu trúc website
Tối ưu website
Điều hướng trang web
Tối ưu hóa nội dung
Content
Heading
Tối ưu hình ảnh
Ranking
Offpage
Quản lý và phân tích website
Webmaster tools
Analytics
Giáo trình được tổng hợp từ nhiều nguồn trong - ngoài nước và đúc rút từ kinh nghiệm bản thân. Ngoài giáo trình này bạn yêu SEO cũng có thể tham khảo thêm bộ tài liệu về SEO do chính Google cung cấp. Dưới đây là tài liệu SEO Google bản gốc tiếng Anh, bạn có thể tải về đọc nếu muốn: http://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf
Bạn nào muốn có bản tiếng dịch tiếng Việt vui lòng comment và điền chính xác email để VietMoz gửi cho các bạn nhé.
Mọi người làm ơn đừng đưa giáo trình tự học SEO này đi đâu, dù theo cách này hay cách khác.
Xin đừng sao chép, đánh cắp ý tưởng, chỉnh sửa, biên tập, phát tán,...khi chưa xin phép và được sự đồng ý của tác giả.
Ai có nhu cầu sử dụng vào mục đích cá nhân, có thể liên hệ trực tiếp để mua bản quyền :)
Tái bút: Mình sẽ post mỗi ngày một - 2 bài vào lúc 10 sáng hàng ngày, kể từ ngày hôm nay. Để nhận được thông báo cũng như bài học mới nhất, bạn có thể để lại email bằng cách phản hồi cho mình. Mỗi phản hồi của các bạn là sự động viên khích lệ cho mình tiếp tục soạn thảo giáo trình SEO cơ bản này.
Đối với các bạn không có nhiều thời gian để tự học làm SEO, các bạn có thể đăng ký ngay khóa đào tạo SEO của VietMoz, chỉ trong 27 tiếng học liên tục các bạn hoàn toàn có thể khám phá mọi bí mật của SEO
Chúc các bạn sớm trở thành 1 chuyên gia về SEO !
Tác giả bài viết: Lê Nam
Nguồn tin: http://vietmoz.net
Nguồn tin: http://vietmoz.net
10 thanh công cụ xuất sắc nhất trên Internet
Tags: Google Toolbar, Internet Explorer, Viewpoint Toolbar, Advanced Searchbar, … Hơn, ‘hộp Copernic’, nút trên thanh công cụ, động cơ tìm kiếm, Phần mềm gián điệp, thực hiện công việc, người sử dụng, bên cạnh đó, Trình duyệt Internet, thực sự là, tính năng, kiểu
Có thể nói những thành
công to lớn mà Google Toolbar đã giành được là động lực thúc đẩy nhiều
công ty khác phát triển các thanh công cụ của riêng mình. Tuy nhiên, hầu
hết những thanh công cụ này lại mang tính chất là công cụ phục vụ
marketing nhiều hơn. Chúng được thiết kế ra để với mục đích đưa người sử
dụng đến thăm một trang web cung cấp dịch vụ tìm kiếm trên mạng hay một
trang web của nhà tài trợ phát triển. Nhưng cũng có một số thanh công
cụ nhằm mục đích giúp cho việc lướt web của bạn trở nên hiệu quả và thú
vị hơn.
Sau đây chúng tôi xin điểm qua 10 thanh công cụ được xem là tốt nhất hiện nay. Tất cả những thanh công cụ này đều có thể cấu hình được và tương thích tốt với trình duyệt Internet Explorer cũng như một số trình duyệt web phổ biến khác. Và tất nhiên chúng đều là các ứng dụng miễn phí. Chú ý: Bạn nhớ là phải đọc kĩ bản chính sách riêng tư (privacy policy) của các thanh công cụ này. Một số thanh công cụ thu thập thông tin cá nhân của người sử dụng để phục vụ cho mục đích marketing hay theo dõi ghi nhận thói quen lướt web của bạn cũng như vô số các thông tin khác mà chúng có thể khai thác được từ người sử dụng. Hầu hết các thanh công cụ được nói đến trong bài viết này đều không thu thập thông tin của người sử dụng nhưng một số lại không có được chính sách riêng tư hợp lý cho lắm. Vì thế bạn lưu ý là nên luôn luôn sử dụng một phần mềm bảo mật chống virus để quét bất kỳ một phần mềm nào mà bạn tải về trên mạng. Google Toolbar 3.0 ( Http://toolbar.google.com ) Google Toolbar hiện vẫn là một trong những ứng dụng hàng đầu. Thanh công cụ cho phép bạn truy nhập các tính năng hiện có của Google từ bất kỳ một trang web nào cũng như mang lại cho bạn khả năng tìm kiếm nội dung trong các trang web bằng động cơ tìm kiếm của Google. Bên cạnh đó Google Toolbar còn mang đến cho bạn tính năng chặn quảng cáo kiểu pop-up, tự động lọc các form, kiểm tra lỗi chính ta, dịch thuật và tính năng tự động liên kết cho phép liên kết các địa chỉ tên đường phố đến bản đồ trực tuyến của Google. Bạn cũng có thể tích hợp Google Toolbar với Google Desktop Search giúp cho việc truy nhập tài nguyên trên máy tính của bạn cũng như việc khởi động các ứng dụng trở nên dễ dàng hơn. Google Toolbar cũng có phiên bản dành cho trình duyệt Firefox. Tất nhiên Google Toolbar tương thích tốt nhất với trình duyệt Internet Explorer. Yahoo! Toolbar ( http://toolbar.yahoo.com ) Yahoo! Toolbar mang đến cho bạn khả năng chặn quảng cáo kiểu pop-up và tính năng chống phần mềm gián điệp. Cũng như thanh công cụ Google, Yahoo! Toolbar giúp cho bạn truy nhập dễ dàng đến các dịch vụ của Yahoo! như Yahoo! Music Engine, tin tức hay thông tin thời tiết. Tuy nhiên, để truy nhập và sử dụng các dịch vụ đó bạn lại cần phải có một tài khoản Yahoo!. Mới đây, Yahoo! vừa cho ra mắt một phiên bản thanh công cụ dành cho trình duyệt mã nguồn mở Firefox. Tuy nhiên phiên bản này lại thiếu đi một số tính năng nếu đem so sánh với phiên bản dành cho trình duyệt Internet Explorer. A-ToolBar 3.0 (http:// www.metaeureka.com ) A-ToolBar 3.0 mang đến cho người sử dụng tới 50 công cụ khác nhau - một con số đáng kinh ngạc. Tuy nhiên trái với những gì mà người sử dụng mong đợi từ đặc điểm “đa dụng” của thanh công cụ này, tính hữu dụng của các tính năng A-ToolBar lại không giống nhau – một số thực sự hữu dụng nhưng số khác lại không. Ví dụ tính năng biểu đồ nhịp sinh học hay công cụ tính toán một tình yêu có thể sẽ không có mặt trong danh sách các tính năng được sử dụng thường xuyên của bạn nhưng tính năng tìm kiếm trên PC (desktop search) hay công cụ hoán đổi đơn vị tiền tệ thì lại thực sự hữu ích cho bất kỳ một ai. Bên cạnh đó bộ sưu tập đầy đủ 20 công cụ mạng và web cũng sẽ làm cho cả những người sử dụng cao cấp hài lòng. Tính năng chặn quảng cáo kiểu pop-up, tính năng metasearching cùng với khả năng bổ sung thêm các động cơ tìm kiếm mới cho thanh công cụ khiến cho A-ToolBar thực sự trở thành một ứng dụng mở A+. Quero Toolbar (http:// www.quero.at ) Nhỏ gọn và đơn giản, thanh công cụ Quero tập trung vào “chuyên môn tìm kiếm” của mình hơn là cung cấp hàng loạt các công cụ hiếm khi sử dụng hay gây bối rối cho người sử dụng. Thay vì chiếm lấy những không gian quí giá trên màn hình desktop thì Quero lại thay thế thanh địa chỉ chuẩn trong Internet Explorer. Sử dụng thanh công cụ Quero người sử dụng có thể lựa chọn qua lại giữa 12 động cơ tìm kiếm hữu ích hay công cụ Flash tích hợp sẵn cùng với khả năng chặn quảng cáo kiểu pop-up. Bên cạnh đó Quero còn cho phép người sử dụng phím tắt hay chức năng tìm kiếm “find-as-you-type” – tìm kiếm trực tiếp khi bạn nhập từ khóa. Có lẽ tính năng đặc biệt nhất trong Quero là khả năng “zoom” – phóng to những gì hiển thị trên màn hình, một tính năng được thiết kế cho những người yếu thị lực. jetToolBar (http:// www.cowonamerica.com ) jetToolBar được đánh giá là một thanh công cụ được thiết kế rất tốt. Thanh công cụ chiếm một ví trí “rất khiêm nhường” trên màn hình desktop với các chức năng cho phép ban tổ chức sắp xếp tìm kiếm và khởi động các chương trình ứng dụng trang web một cách rất nhanh chóng và đơn giản. Các shortcut ứng dụng được tổ chức theo hàng chục các mục được bố trí theo theo tab khác nhau khiến cho việc truy nhập chúng trở nên thuận tiện hơn. Bên cạnh đó các nút trên thanh công cụ còn có thể được tăng hay giảm kích cỡ với bẩy mức độ khác nhau khiến cho người sử dụng dễ đọc và quan sát chúng hơn. jetToolBar hoàn toàn nằm trong tầm tay của bạn, thanh công cụ hỗ trợ tính năng tùy biến toàn diện cho phép bạn có thể kéo-và-thả các nút bấm hay mục khác nhau một cách khá dễ dàng hoặc bạn có thể khóa cứng thanh công cụ vào một góc nào đó của màn hình desktop. Nếu bạn có một chiếc microphone bạn còn có thể chạy các phần mềm với âm thanh riêng của bạn. Advanced Searchbar (http:// www.advancedsearchbar.com ) Mặc dù cái tên của thanh công cụ này có thể không thu hút được sự chú ý của bạn nhưng chắc chắn tính năng của nó thì có. Advanced Searchbar mang đến cho bạn khoảng 100 động cơ tìm kiếm khác nhau, 60 nhà cung cấp tin tức cùng với hơn ba chục ứng dụng gửi nhận email. Advanced Searchbar còn được trang bị rất nhều ứng dụng quét diệt phần mềm gián điệp phổ biến, blog và trình gửi nhận tin nhắn tức thời. Các biểu tượng trên thanh công cụ cho phép bạn truy nhập một cách dễ dàng đến nhiều ứng dụng tính năng khác nhau bao gồm tính năng chia tách tệp tin, đọc luồng RSS, máy tính, dự báo thời tiết, chặn quảng cáo kiểu pop-up hay dịch trang web... Viewpoint Toolbar (http:// www.viewpoint.com/pub ) Viewpoint Toolbar mang đến cho bạn một phương thức độc nhất vô nhị và rất tiết kiệm thời gian trong việc lướt web và tìm kiếm bằng cách cho phép bạn xem trước các kết quả tìm kiếm bằng các bức ảnh thu nhỏ thời gian thực và cùng với các đoạn văn bản chú giải nội dung. Bạn có thể dễ dàng lưu trữ, tìm kiếm và chia sẻ các địa chỉ ưa thích bằng chính phương thức kể trên. Thanh công cụ còn tạo sự thuận tiện cho bạn trong việc truy nhập và lưu trữ địa chỉ các trang web quan trọng. Tất nhiên, Viewpoint Toolbar cũng có các tính năng như chặn quảng cáo kiểu pop-up hay ứng dụng quản lý ảnh kỹ thuật số. Furl Toolbar (http:// www.looksmart.com ) Bất kỳ một ai đã từng cảm thấy tức tối với việc có ý dung lượng bộ nhớ hay các bookmark “đã chết” chắc chắn sẽ thích thanh công cụ Furl. ứng dụng này thực sự là một hướng đi mang tính cách mạng trong việc tìm kiếm trên web. Thanh công cụ Fur biến những trang web trên Internet thành trang web riêng của bạn bằng cách mang đến cho bạn 5GB dung lượng trên máy chủ của Furl để lưu trữ bất kỳ trang web nào bạn đã truy nhập và sau đó bạn có thể truy nhập lại những trang web này trên máy chủ của Furl với bất kỳ một chiếc máy tính nào có kết nối Internet. Bạn có thể chia sẻ những trang web này hay giữ chúng cho riêng mình. Đây thực sự là một giải pháp lý tưởng cho sinh viên và các nhà nghiên cứu. Copernic Meta ( http://www.copernic.com ) Đây thực sự là một động cơ tìm kiếm lý tưởng dành cho các nhà nghiên cứu trên web. Công cụ này thực hiện công việc lùng sục vào tận trong (metasearch) các trang web, bức ảnh, âm thanh, tệp tin đa phương tiện truyền thông, tin tức, đấu giá … Hơn thế nữa bạn còn có thể không cần phải mở trình duyệt, bạn có thể tiến hành công việc tìm kiếm từ bất kỳ một ứng dụng nào bất cứ lúc nào thông qua một ‘hộp Copernic’ trên thanh trình đơn Start. Bên cạnh đó Copernic còn hỗ trợ các mục đặc biệt như Web, Shopping, Dictionary hay Thesaurus với khả năng thực hiện tìm kiếm trên nhiều động cơ tìm kiếm cùng một lúc theo như chủ điểm trên. Bạn cũng có thể bổ sung và quản lý các động cơ tìm kiếm riêng của bạn, thiết lập phím tắt hay tìm kiếm thông tin bằng cách lựa chọn từ khóa trực tiếp trong trang web. Blinkx (http:// www.blinkx.com ) Không một ai muốn người lạ đọc các nội dung trên PC của mình nhưng nếu người lạ đó là một chiếc máy tính thì sao? Bạn có thể gọi người là đó là bạn được không? Với Blinkx thì bạn có thể đấy. Đây là một phần mềm gây ngạc nhiên cho người sử dụng vì nó có thể sử dụng các thuật toán cao cấp để truy nhập tiếp cận các thông tin mà bạn đang xem sau đó tìm kiếm các thông tin tương tự như thế từ các trang web, các bài báo, video cũng như các tệp tin hay email trực tiếp trên PC của bạn. Bạn không cần phải có các từ khóa hay các phương thức tìm kiếm phức tạp để tìm kiếm lại nữa. Với quá nhiều các thông công cụ như vậy nên chúng ta cũng khó có thể quyết định một cách chắc chắn thanh công cụ nào là thích hợp cho tất cả mọi người. Trên thực tế có thể bạn cũng sẽ gặp khó khăn trong việc quyết định thanh công cụ nào phù hợp với bạn. Nhưng có một điều chắc chắn là hiện đã có rất nhiều các thanh công cụ hữu ích nhằm giúp bạn làm việc lướt web hiệu quả hơn. Lợi ích do những ứng dụng như thế này mang lại là rất nhiều và khác nhau bao gồm việc truy nhập dễ dàng hơn tới các động cơ tìm kiếm, tin tức, thời tiết, chứng khoán, video... Bạn vẫn chưa quyết định được thanh công cụ nào phù hợp với bạn? Có lẽ bạn muốn tất cả hay không muốn bất kỳ thanh công cụ nào trong số đó. ToolbarBrowser ( http://www.toolbarbrowser.com ) sẽ giúp bạn giải quyết vấn đề đó. Nếu bạn quan tâm tới vấn đề màn hình PC của bạn là khá nhỏ và hạn chế thì ToolbarBrowser sẽ dùng phương thức điều khiển kiểu tab nhằm làm cho công việc quản lý đa thanh công cụ trở nên dễ dàng hơn. Nếu như vậy là vẫn chưa đủ thì bạn có thể tạo ra thanh công cụ riêng của mình ToolbarBrowser sẽ giúp bạn làm công việc đó. Bạn có thể lựa chọn những đặc tính tốt nhất của các thanh công cụ trên và sáng tạo ra thanh công cụ riêng của bạn. Trang web của ToolbarBrowser cung cấp cho bạn những sự trợ giúp toàn diện bao gồm cả những bài hướng dẫn, FAP và diễn đàn hỗ trợ. Mặc dù ToolbarBrowser chỉ tương thích với trình duyệt Internet Explorer nhưng bạn vẫn có thể sáng tạo ra thanh công cụ riêng của mình bằng ngôn ngữ HTLM, XML, Java hay thậm trí là cả Flash.
(Theo TC BCVT)
http://vietbao.vn/Vi-tinh-Vien-thong/10-thanh-cong-cu-xuat-sac-nhat-tren-Internet/65109267/229/
Công cụ tìm kiếm thông tin Internet
Chủ nhật, ngày 20 tháng 9, năm 2009
Công cụ tìm kiếmSearch Engine trên Internet hay các công cụ tìm kiếm là các site đặc biệt trên web, được thiết kế để giúp mọi người tìm kiếm thông tin được lưu trên các site khác nhau. Có nhiều cách khác nhau trong cách tìm kiếm này, nhưng tất cả chúng đều thực hiện ba nhiệm vụ cơ bản:
Xem xét WebKhi hầu hết mọi người nói về các công cụ máy tìm kiếm Internet, họ đều cho đó là công cụ tìm kiếm World Wide Web. Tuy nhiên trước khi Web trở thành phần dễ thấy nhất của Internet thì thực sự đã có các công cụ tìm kiếm để giúp mọi người có thể tìm được các thông tin trên mạng. Các chương trình với những cái tên như “Gopher” và “Archie” đã giữ chỉ số của các file được lưu trên máy chủ kết nối với Internet, đã giảm được một cách rõ rệt số lượng thời gian cần thiết để tìm kiếm các chương trình và tài liệu. Vào những năm cuối thập kỷ 80, việc có được các giá trị quan trọng từ Internet có nghĩa là biết cách sử dụng Gopher, Archie, Veronica và một số chương trình tương tự khác.Ngày nay, hầu hết người dùng Internet chưa hiểu nhiều về cách tìm kiếm của họ trên Web, chính vì vậy chúng tôi sẽ giới thiệu vấn đề này bằng cách tập trung vào nội dung của các trang web. Khởi đầu công cụ tìm kiếmHình 1 : Spider lấy nội dung của trang web và tạo các từ khóa tìm kiếm để cho phép người dùng trực tuyến có thể tìm các trang mong muốn Bọ tìm kiếm (Spider)Trước khi công cụ tìm kiếm có thể cho bạn biết về nơi một file hoặc tài liệu nào đó được lưu trữ thì nó phải tìm ra được chúng. Để tìm các thông tin trên hàng trăm triệu trang web đang tồn tại, mỗi một công cụ tìm kiếm phải sử dụng đến các robot phần mềm đặc biệt, các robot phần mềm này được gọi là spider (con nhện hay bọ tìm kiếm), để thành lập danh sách các từ tìm thấy trong các website. Quá trình spider xây dựng danh sách được gọi là đánh chỉ số hoá (Web crawling). Để tạo và duy trì một danh sách hữu dụng cho việc tìm kiếm thì spider của công cụ tìm kiếm phải xem được nội dung của các trang web.Tách lọc nội dungVậy cách spider thực hiện công việc của nó trên Web như thế nào? Điểm khởi đầu là danh sách các máy chủ và trang web phổ biến. Spider sẽ bắt đầu với một site phổ biến nào đó, đánh chỉ mục các từ trên trang của nó và theo các liên kết tìm thấy bên trong site này. Theo cách này, hệ thống Spider sẽ nhanh chóng thực hiện công việc của nó và trải rộng ra toàn bộ các phần được sử dụng rộng rãi nhất của web.Spider lấy nội dung của trang web và tạo các từ khóa tìm kiếm để cho phép người dùng trực tuyến có thể tìm các trang mong muốn. Google.com bắt đầu như một công cụ tìm kiếm của trường đại học. Trong bài viết mô tả về cách hệ thống được xây dựng như thế nào, Sergey Brin và Lawrence Page đã lấy một ví dụ về spider của họ có thể làm việc nhanh đến cỡ nào. Họ đã xây dựng hệ thống ban đầu để có thể sử dụng nhiều spider, thường là có đến 3 spiders hoạt động đồng thời. Mỗi Spider có thể giữ tới khoảng 300 kết nối với các trang web mỗi thời điểm. Với hiệu suất đỉnh của nó, sử dụng đến 4 Spider, hệ thống của họ có thể tìm thêm trên 100 trang mỗi giây, tạo ra khoảng 600KB dữ liệu mỗi giây. Tốc độ tìm kiếmViệc giữ được tốc độ tìm kiếm nhanh cũng có nghĩa phải xây dựng hệ thống có thể cung cấp được các thông tin cần thiết cho Spider. Hệ thống Google trước kia có một máy chủ chuyên dụng dùng để cung cấp các URL cho Spider. Thay cho việc phụ thuộc vào nhà cung cấp dịch vụ về DSN để dịch tên của máy chủ thành địa chỉ, Google đã có DSN của chính họ để độ giữ chậm diễn ra chỉ trong khoảng thời gian tối thiểu.Yếu tố quan trọngKhi bọ tìm kiếm (Spider) của Google xem các trang HTML, nó lưu ý hai thứ:
Phương pháp đánh chỉ sốCác phương pháp khác mà bọ tìm kiếm (Spider) áp dụng thường là cố gắng làm cho hệ thống của Spider diễn ra nhanh hơn, cho phép người dùng có thể tìm kiếm hiệu quả hơn, hoặc cả hai. Ví dụ, một số Spider giữ liên hệ với các từ trong tiêu đề, các heading nhỏ và liên kết, cùng với 100 từ thường được sử dụng trên trang và các từ trong 20 dòng đầu tiên của văn bản.Các hệ thống khác chẳng hạn như AltaVista lại tiếp cận theo một hướng khác, đánh chỉ mục các từ đơn trên mỗi trang, gồm có cả “a,” “an,” “the” và các từ “không quan trọng” khác. Tính đầy đủ trong phương pháp này được so khớp bởi các hệ thống khác trong phần thẻ meta của Website. Các thẻ MetaPhân tích khai báo thẻ MetaThẻ Meta cho phép chủ sở hữu của trang có thể chỉ định các từ khóa và khái niệm sẽ được đánh chỉ mục. Đây là một trong các thẻ rất hữu dụng, đặt biệt trong nhiều trường hợp các từ trên trang có thể có đến hai hoặc 3 nghĩa – thẻ Meta có thể hướng dẫn công cụ tìm kiếm trong việc chọn nghĩa nào trong số các nghĩa có thể là đúng đối với một từ nào đó. Tuy vậy vẫn có một lo lắng trong việc tin cậy nhiều vào thẻ Meta vì các trang kém chất lượng mà chủ sở hữu của nó lại đưa vào thẻ này những chủ đề phổ biến nhưng không có nội dung gì về nó. Để khắc phục hiện tượng này, Spider sẽ tương quan các thẻ Meta với nội dung của trang, loại ra các thẻ không thỏa khớp với các từ trong trang.Thẻ Meta loại trừ RobotTất cả vấn đề này khởi nguồn từ chủ sở hữu của trang này, họ muốn trang web được hiển thị trong kết quả tìm kiếm của các công cụ tìm kiếm này. Nhiều khi, chủ sở hữu không muốn trang của họ xuất hiện trên các trang kết quả của một công cụ tìm kiếm hoặc không muốn Spider truy cập vào trang của họ. (Ví dụ, một game xây dựng các trang active mới mỗi lần các section của trang được hiển thị hoặc theo sau là các liên kết mới. Nếu một Spider Web có thể truy cập vào và bắt đầu đi theo tất cả liên kết cho các trang mới thì game có thể mắc lỗi activity cho player tốc độ cao và kéo dài sự kiểm soát.) Để tránh tình trạng này, giao thức loại trừ robot đã được phát triển. Giao thức này bổ sung vào phần thẻ meta ở bắt đầu mỗi trang, thông báo cho Spider phải rời trang của nó – không đánh chỉ mục các từ trên trang này hoặc cố gắng lần theo các liên kết của nó.Xây dựng chỉ mụcLưu trữ dữ liệu chỉ mục tìm kiếmKhi Spider đã hoàn tất nhiệm vụ tìm thông tin trên các trang web (chúng tôi lưu ý rằng đây là nhiệm vụ không bao giờ hoàn tất vì luôn có sự thay đổi của các trang nên điều đó có nghĩa là Spider sẽ luôn thực hiện nhiệm vụ của nó), công cụ tìm kiếm phải lưu các thông tin này theo một cách nào đó để có lợi nhất. Có hai thành phần chính liên quan tới việc tạo dữ liệu đã thu thập được để có thể truy cập với người dùng:
Phân loại chỉ mục tìm kiếmĐể làm cho các kết quả tìm kiếm được phù hợp nhất, hầu hết các công cụ tìm kiếm đều lưu nhiều từ và URL. Một công cụ tìm kiếm có thể lưu số lần từ nào đó xuất hiện trong một trang. Nó có thể gán “trọng lượng” cho mỗi một entry nào đó, tăng dần giá trị gán cho các từ khi chúng xuất hiện gần phía trên của tài liệu, trong các heading con, các liên kết và trong thẻ meta hoặc trong tiêu đề của trang. Mỗi một công cụ tìm kiếm mang tính thương mại đều có một công thức khác nhau đối với việc gán trọng lượng cho các từ trong chỉ mục của nó. Đây chính là một trong những lý do tại sao một tìm kiếm cho những từ giống nhau trên các công cụ tìm kiếm khác nhau lại cho ra danh sách khác nhau, các trang được thể hiện theo thứ tự khác nhau.Xây dựng chỉ mục tìm kiếmKhông quan tâm đến sự kết hợp nghiêm ngặt các mẩu thông tin bổ sung được lưu bởi mỗi công cụ tìm kiếm, dữ liệu sẽ được mã hóa để lưu trữ trong các điểm lưu trữ riêng.Một chỉ mục chỉ có một mục đích: Nó cho phép thông tin được tìm thấy một cách nhanh chóng. Có khá nhiều cách cho việc xây dựng chỉ mục, nhưng cách hiệu quả nhất vẫn là xây dựng một bảng hash. Một công thức được sử dụng để gắn giá trị bằng số cho mỗi một từ. Công thức này được thiết kế để cung cấp cho các entry trên số lượng được xác định trước các phần chia. Phần chia bằng số này khác với phần chia từ trong bảng alphabet và đó chính là hiệu lực chính của bảng hash. Trong tiếng Anh, có một số ký tự được bắt đầu nhiều hơn với các ký tự khác. Ví dụ như bạn sẽ thấy phần “M” của từ điển sẽ dày hơn phần “X”. Sự không công bằng này có nghĩa rằng việc tìm một từ bắt đầu với một ký tự “phổ biến” có thể lâu hơn nhiều so với việc tìm một từ bắt đầu với một ký tự kém phổ biến hơn. Thuật toán Hash cân bằng sự khác nhau này, và giảm thời gian trung bình để tìm kiếm mỗi entry. Nó cũng phân biệt chỉ mục với entry thực tại. Bảng hash gồm có các số được đánh hash cùng với một con trỏ dữ liệu, con trỏ này có thể được phân loại theo bất cứ cách nào cho phép lưu trữ hiệu quả nhất. Sự kết hợp giữa việc đánh chỉ mục hiệu quả và lưu trữ hiệu quả làm cho người dùng có thể thực hiện các thao tác tìm kiếm một cách nhanh chóng thậm chí khi họ tạo một tìm kiếm phức tạp. Xây dựng truy vấn tìm kiếmViệc tìm kiếm thông qua một chỉ mục cần người dùng xây dựng một truy vấn và đệ trình nó thông qua công cụ tìm kiếm Search Engine. Truy vấn có thể khá đơn giản như một từ chẳng hạn. Việc xây dựng một truy vấn phức tạp hơn cần sử dụng các toán tử Boolean để cho phép bạn lọc và mở rộng dưới dạng tìm kiếm.Các toán tử Boolean thường được sử dụng nhất là:
Tìm kiếm trong tương laiCác tìm kiếm đã được định nghĩa bởi toán tử Boolean trở nên khá bình thường, công cụ tìm kiếm sẽ tìm kiếm các từ hoặc cụm từ chính xác khi chúng được nhập vào. Điều này có thể phát sinh một vấn đề khi các từ được nhập có đa nghĩa. Nếu bạn chỉ quan tâm đến một trong các nghĩa đó thì có thể không muốn thấy xuất hiện các trang tiêu biểu cho tất cả các nghĩa của nó. Tuy bạn có thể tạo một tìm kiếm bằng cách loại trừ ra các nghĩa không mong muốn nhưng nếu công cụ tìm kiếm giúp được bạn việc này thì tốt biết bao.Một trong những lĩnh vực nghiên cứu tìm kiếm là tìm kiếm dựa trên khái niệm. Một số nghiên cứu này liên quan đến việc sử dụng phân tích thống kê về các trang chứa từ hoặc cụm từ mà bạn tìm kiếm, để tìm ra các trang khác có thể bạn quan tâm. Rõ ràng các thông tin được lưu trong mỗi trang thực sự rất quan trọng cho tìm kiếm dựa trên khái niệm, và xa hơn nữa là việc xử lý được yêu cầu cho mỗi tìm kiếm. Nhiều nhóm nghiên cứu đã và đang làm việc hết mình để cải thiện cả kết quả và hiệu suất của các công cụ tìm kiếm này. Một số nhóm khác đã chuyển sang một lĩnh vực nghiên cứu khác như truy vấn ngôn ngữ tự nhiên. Ý tưởng ẩn đằng sau nghiên cứu truy vấn ngôn ngữ tự nhiện là bạn có thể đánh vào đó một câu hỏi giống như cách bạn hỏi đối với người ngồi bên cạnh bạn – khong cần đến các toán tử Boolean hoặc các cấu trúc truy vấn phức tạp. Site truy vấn ngôn ngữ tự nhiên nhất hiện nay là AskJeeves.com, nó có khả năng phân tích cú pháp truy vấn về các từ khóa để áp dụng cho chỉ mục của các site mà nó đã xây dựng. Tuy nhiên site này chỉ làm việc với các truy vấn đơn giản vì việc đặt khái niệm cho một truy vấn khá phức tạp. Sưu tầm và biên tập bởi Nguyễn Hoài Nam – www.vietSEO.net |
Không có nhận xét nào:
Đăng nhận xét