Thứ Năm, 10 tháng 4, 2014

Google Power Search - Vấn đề thứ tự trong từ ngữ

Phần 1.5 - Những vấn đề về Thứ tự trong từ ngữ

Vấn đề thứ tự của từ ngữ trong Google
Vấn đề thứ tự của từ ngữ trong Google
NỘI DUNG PHẦN NÀY XOAY QUANH:
  • Những vấn đề về từ ngữ
  • Những vấn đề về Thứ tự trong từ ngữ
  • Chữ hoa không ảnh hưởng kết quả search
  • Dấu câu & Ký hiệu thường không ảnh hưởng
  • Vấn đề chính tả - Được gợi ý chỉnh sửa

Trong bài viết trước, chúng ta đã nói về cách chọn lựa từ ngữ trong truy vấn tìm kiếm. Phần này tập trung vào cách bạn sắp xếp và sử dụng những từ này (khi bạn gõ vào công cụ tìm kiếm), xem những vấn đề này ảnh hưởng đến kết quả ra sao?

1. Những vấn đề về từ ngữ

Chúng ta đã biết là mỗi một từ trong truy vấn đều có khả năng ảnh hưởng đến kết quả tìm kiếm. Trong phần này ta hãy xét 3 ví dụ là [who], [a who] và [the who]. Trong tiếng việt, bạn hãy thử 3 ví dụ là [nhà], [ngôi nhà] và [căn nhà] xem thế nào nhé.

Kết quả search "who"
Kết quả search "who"
Kết quả trả về đầu tiên là tổ chức y tế thế giới, viết tắt của từ "World Health Organization". Bạn có để ý là từ "who" xuất hiện ngay trong tiêu đề và địa chỉ website, ngoài ra nó có thể là từ thường xuyên được link về đây từ các website khác.

Giờ ta hãy đặt một mạo từ đơn ở phía trước để hình thành truy vấn [a who], bạn sẽ thấy kết quả trả về hoàn toàn khác như sau (ở đây tôi search với cookies hết nhé):

Kết quả search "a who"
Kết quả search "a who"
Trong trường hợp này kết quả trả về dữ liệu của bộ phim nổi tiếng "Horton Hears a Who!", chà tôi chưa từng xem bộ phim này bao giờ. Các kết quả khác của wiki có lẽ nói đến thông tin của bộ phim.

Một khác biệt nhỏ như mạo từ "a" có thể gây nên khác biệt lớn trong kết quả tìm kiếm, do Google biết là ai đó muốn phân biệt thông tin giữa "World Health Organization" và "Horton Hears a Who!".

Tiếp theo ta hãy search từ "the who" xem kết quả thế nào.

Đây là kết quả search của "the who"
Đây là kết quả search của "the who"
Lần này cũng vậy, một mạo từ xác định "the" có thể mang lại một kết quả rất khác, ở đây truy vấn của chúng ta trả về thông tin của một ban nhạc có tên là "The Who".

Giờ ta hãy kiểm tra kết quả search trong tiếng Việt chút nhé, hãy search từ "nhà" xem kết quả đầu tiên là gì (trong ví dụ này ta hãy gõ tiếng Việt có dấu là "nhà", dĩ nhiên trường hợp gõ không dấu sẽ cho ra những kết quả hoàn toàn khác)

Kết quả search từ "nhà"
Kết quả search từ "nhà"
Kết quả đầu tiên thuộc batdongsan và muabannhadat, nhưng kết quả phía bên phải là graph của wiki, như vậy trong tìm kiếm của tôi, google vẫn xem trọng định nghĩa từ wiki, tại sao vậy? Phải chăng do wiki siêng định nghĩa graph search hơn cho google? Giờ ta hãy search ở chế độ no cookies xem thế nào.

Kết quả search "nhà" đã xóa cookies
Kết quả search "nhà" đã xóa cookies
Thật đặc biệt! Như vậy kết quả trước đó cho thấy là Google xem trọng cookies của tôi, tôi làm ở công ty Địa Ốc, nên các kết quả của tôi có liên quan đặc biệt đến nhà cửa ở khu vực Tp. HCM, nơi có công ty batdongsan và muabannhadat. Đồng thời, cách đó mấy phút, tôi search những từ tiếng anh như "who" liên quan đến wiki, nên kết quả tìm kiếm ưu tiên graph của wiki.

Còn trong trường hợp sau, các kết quả tìm kiếm sau khi xóa cookies là hoàn toàn khác, graph và vị trí tìm kiếm leo hẳn ra các công ty tại Hà Nội (có thể do đối với keyword "nhà" thì các công ty này SEO tốt hơn, hoặc có sự liên quan cao hơn với từ khóa này).

Trong trường hợp search từ khóa "ngôi nhà" ta có kết quả như sau:

Kết quả search từ khóa "ngôi nhà"
Kết quả search từ khóa "ngôi nhà"

Kết quả này cho thấy Google xem nặng định nghĩa và hình ảnh trong truy vấn từ khóa này. Rõ ràng, hành vi search từ khóa "ngôi nhà" mang nặng tính hỏi về ngữ nghĩa; mặt khác, không có trường hợp đặc biệt nổi bật trong kết quả tìm kiếm như tên bộ phim hay tên nhân vật nổi tiếng ...

2. Vấn đề về trật tự sắp xếp từ ngữ

Đây là một yếu tố sẽ ảnh hưởng đến kết quả truy vấn tìm kiếm của bạn.

Bây giờ, hãy so sánh kết quả search [blue sky] và [sky blue] xem.

Kết quả search "blue sky"
Kết quả search "blue sky"

Còn đây là kết quả search "sky blue"
Còn đây là kết quả search "sky blue"
Không cần phải xét quá nhiều ví dụ, như trên, bạn cũng có thể thấy là kết quả search hoàn toàn khác nhau. "Blue Sky" cho ra tên một phim trường và tên một bài nhạc trong graph và kết quả cho ra hình ảnh của bầu trời --> Google cũng cho ra kết quả từ wiki làm rõ nghĩa hiện tượng khi bầu trời có màu xanh.

Ngược lại, "Sky Blue" cho ra tên một bộ phim và tên một câu lạc bộ trong graph, đồng thời kết quả search nhấn mạnh nhất là việc định nghĩa về một màu xanh "sky blue" của Wiki.

3. Kết quả tìm kiếm không phân biệt chữ hoa hay chữ thường

Nhiều người cho rằng Google hay để ý đến những tiểu tiết trong từ ngữ, như chữ hoa hay chữ thường. Thực tế thì, vấn đề sai chính tả, chữ hoa - chữ thường và các ký tự đặc biệt là những vấn đề Google không quan tâm đến, thậm chí nó còn có các thuật toán để có thể bỏ qua những tiểu tiết này. Ví dụ đây:

Tôi sẽ tìm kiếm thử tên của mình, và bạn sẽ thấy 2 kết quả viết thường và viết hoa lung tung cho ra hoàn toàn giống nhau như đúc.

Kết quả tìm kiếm "nguyễn thượng đan" viết thường
Kết quả tìm kiếm "nguyễn thượng đan" viết thường
Kết quả tìm kiếm "NGUYỄN THƯỢNG ĐAN" viết hoa
Kết quả tìm kiếm "NGUYỄN THƯỢNG ĐAN" viết hoa
4. Google cũng không quan tâm đến các dấu câu

Tương tự như vậy, Google cũng không quan tâm đến các ký tự đặc biệt như dấu "section" (§) hay dấu "paragraph" (¶), hay dấu "trademark" (®)...  và các ký tự đặc biệt khác khi bạn sử dụng trong truy vấn. Hãy thử 2 truy vấn là [2010] và [®2010] xem.

Kết quả truy vấn "2010"
Kết quả truy vấn "2010"
Kết quả truy vấn "Trademark 2010"
Kết quả truy vấn "Trademark 2010"
Tuy nhiên, cũng có những ký tự sẽ tạo ra những truy vấn rất khác. Google có thể xem trong ký tự (+) trong truy vấn nếu bạn truy vấn các trường hợp như "Google+", "C++", hay "+Google". Hoặc ký tự (#) trong các trường hợp như "#Google" hay "C#". Hoặc ký tự (@) như "@Google". Hoặc ký tự (%) trong "45%".

** Trong truy vấn Email Google xem truy vấn [courtney@dogs.com] giống như truy vấn [courtney dogs com] --> tôi đã thử 2 truy vấn này tuy nhiên kết quả có khác biệt đôi chút, có thể Google đã phân biệt được mức độ quan trọng của những domain trong email.

Sau đây là những ký tự có giá trị trong truy vấn Google mà bạn cần lưu ý:

SymbolVí dụ điển hình cho mục đích sử dụng
[+]Tìm nhóm máu [AB+] hoặc tìm những trang như Google Plus [+Chrome]
[@]Tìm các tags của mạng xã hội [@google
[&]Những cụm có ý nghĩa hoặc ý tưởng đặc thù [A&E]
[%]Giá trị phần trăm [40% of 80]
[$]Chỉ số giá [nikon $400]
[#]Những đề tài được đánh dấu bằng hash (tag) [#lifewithoutgoogle]
[-]Dấu gạch nối liên kết mạnh ngữ nghĩa trong một cụm từ [twelve-year-old dog]
[_]Sử dụng để làm rõ nghĩa [quick_sort]. Bạn dùng để truy vấn cho các cụm từ dính liền (quicksort) nhưng thay vì vậy, bạn có thể làm rõ bằng cách thêm vào dấu gạch dưới (quick_sort).

5. Google không quan tâm đến các truy vấn sai chính tả, hơn nữa khi phát hiện ra các cụm từ sai chính tả trong truy vấn, Google còn gợi ý cho bạn các cụm từ chính xác hơn.

Google đặc biệt giỏi sửa lỗi chính tả. Trong tiếng Anh, nó rất giỏi phân biệt ra các cụm từ chính tả có vấn đề trong tên riêng. Ví dụ [britttney spears] thay vì phải là [britney spears]

Lỗi chính tả "Britttney Spears"
Lỗi chính tả "Britttney Spears"
Google sẽ ngay lập tức gợi ý từ khóa chính xác hơn về chính tả ở phía dưới truy vấn tìm kiếm. Và nếu bạn kiên quyết tìm kiếm với từ khóa cũ của mình thì hãy nhắp vào link "Search instead for ...".

Video Hướng dẫn

Link bài học gốc:  http://www.powersearchingwithgoogle.com/course/ps/assets/textversions/Lesson1.5/Lesson1.5Wordordermatters_Text_.html
Link bài tập: http://www.powersearchingwithgoogle.com/course/ps/activity15.html

Không có nhận xét nào:

Đăng nhận xét