Bài 5: Google hoạt động ra sao ?

Google hoạt động ra sao ? Cơ chế thu thập dữ liệu như thế nào và cách vận hành của google sẽ được tổng hợp lại toàn bộ trong bài viết này.

Cấu tạo của bộ máy tìm kiếm Google Seach Engine

Sự khác nhau giữa con người và công cụ tìm kiếm trong việc đánh giá nội dung của một trang web. Không giống như con người, công cụ tìm kiếm nội dung theo định hướng. Mặc dù công cụ tìm kiếm được trang bị các công nghệ rất hiện đại tuy nhiên nó vẫn không đủ thông minh để có thể cảm nhận được vẻ đẹp của một mẫu thiết kế, thưởng thức âm thanh hoặc thấy được chuyển động của một video nào đó.Cũng giống như các bộ máy tìm kiếm khác google được cấu tạo bởi 3 bộ phận chính:

  • Bộ phận thu thập thông tin từ các website Google Spider (Bot)
  • Bộ phận lập chỉ mục
  • Bộ phận xử lí– tính toán

Bộ phận thu thập dữ liệu của google hoạt động như thế nào

Bộ phận thu thập dữ liệu hay còn có tên gọi thân thiện là Google Spider, google bot hoặc con nhện. Một cách đơn giản bạn có thể hiểu rằng đây là một quá trình mà Google Spider sẽ đi từ trang này sang trang khác để khám phá nội dung và các liên kết trong trang web của bạn. Đây là một quá trình mà Google Spider đang cố gắng tìm các trang web mới và cập nhật thêm vào chỉ mục của Google

Cơ chế hoạt động của công cụ tìm kiếm
Thông thường, website nào chúng ta đều thấy cấu trúc của tệp Rotbots.txt ở mục index. File Robots.txt này có nhiệm vụ điều hướng con bọ tìm kiếm Google Spider. Bản thân Google Spider là một loại Robots hoạt động dựa trên liên kết. Quy trình của nó cũng khá đơn giản. Khi truy cập vào 1 website bất kỳ. Google Spider tìm đọc đến file Robots.txt và File .Htaccess để xem nó được quyền truy cập vào những thư mục nào của website đó. Đồng thời nhận dạng chuỗi liên kết tĩnh Permalink được cấu hình tại File Htaccess. Tiếp sau đó Google Spider tiếp tục truy cập vào File Sitemap.xml (sơ đồ trang web). Tại File Sitmap.xml, Các quản trị web (admin) đã cấu hình sẵn 1 sơ đồ hệ thống thống các webpage.
Google bot có thể coi là một chương trình thu thập dữ liệu và phát hiện ra các trang web mới, thay đổi các trang web hiện có và các truy tìm các liên kết không tồn tại, các dữ liệu này được sử dụng để cập nhật cho các chỉ mục của Google.

Cơ chế hoạt động của bộ phận lập chỉ mục của google

Đây là quá trình xây dựng cơ sở dữ liệu của các từ khóa, cụm từ, các trang web và các trang liên quan đến một lĩnh vực nào đó..Sau khi dữ liệu được Craw thành công sẽ được chuyển tiếp về bộ phận lập chỉ mục. Tại đây Google tiến hành quá trình đọc hiểu, phân loại nội dung và tiến hành lập chỉ mục cho nội dung website của bạn. Mỗi một chỉ mục thường được lưu trữ ở các Sever độc lập khác nhau sau quá trình tính toán, xử lý và mã hóa thông tin dữ liệu!.

Cơ chế hoạt động của bộ phận xử lí– tính toán

Tại quy trình này, dựa vào các dữ liệu thu thập được. Kết hợp cùng hơn 200 tiêu chí xếp hạng từ khóa và gần 500 thuật toán tìm kiếm. Google sẽ tiến hành xuất bản thứ hạng cho website của bạn. Đồng thời mã hóa dữ liệu và lưu vào bộ nhớ Cache.Đây là quá trình tính toán của Google nhằm cung cấp các kết quả cho người tìm kiếm. Theo thống kê, Google sử dụng hơn 200 yếu tố để xếp hạng trang web. Các yếu tố này có tầm quan trọng khác nhau, tuy nhiên một trong những yếu tố quan trọng nhất để xếp hạng đó là dựa trên chất lượng nội dung và chất lượng của những liên kết đến trang web của bạn.

Kết luận

Mặc dù nguyên tắc hoạt động cơ bản của tất cả các công cụ tìm kiếm là như nhau, sự khác biệt nhỏ giữa chúng dẫn đến những thay đổi lớn trong các kết quả liên quan. Đối với các công cụ tìm kiếm khác nhau, các yếu tố khác nhau rất quan trọng. Có những lúc, khi các chuyên gia SEO nói đùa rằng các thuật toán của Bing được cố ý làm chỉ với mục đích đối nghịch với những người của Google.

Incoming search terms:

  • seo-online website

One Response

  1. Link 21/05/2016

Leave a Reply