Chat GPT, Perplexity, Google và Bing: Công cụ AI nào cung cấp câu trả lời chất lượng nhất?

Chia sẻ bài viết

Các công cụ tìm kiếm tích hợp AI ngày càng trở nên phổ biến. Hàng loạt mô hình mới ra đời, nhưng không phải công cụ nào cũng mang lại chất lượng và độ tin cậy như nhau trong các phản hồi.

Trong nghiên cứu này, chúng tôi so sánh khả năng trả lời truy vấn của 4 công cụ AI tìm kiếm: ChatGPT có bật tính năng tìm kiếm (tạm gọi là SearchGPT), Perplexity, Google AI Overviews (AIOs)Bing Search AI (Copilot). Bên cạnh nội dung trả lời, chúng tôi đặc biệt chú ý đến cách các công cụ này lựa chọn và trích dẫn nguồn tham khảo.

Dữ liệu sử dụng trong nghiên cứu:

  • Từ khóa: 2.000 từ khóa thuộc 20 lĩnh vực khác nhau (mỗi lĩnh vực 100 từ khóa)
  • Khu vực phân tích: Hoa Kỳ
  • Thời gian thực hiện: từ 26/2/2025 đến 3/3/2025

Tỷ lệ phản hồi khi chạy truy vấn như sau:

  • Perplexity: 1.999 câu trả lời (99,95%)
  • ChatGPT: 1.998 câu trả lời (99,90%)
  • Bing Copilot: 1.452 câu trả lời (72,60%)
  • Google AIO: 1.163 câu trả lời (58,15%)

Mục tiêu chính là giúp chuyên gia SEO và người làm nội dung hiểu rõ hơn đặc điểm của từng công cụ tìm kiếm AI, từ đó điều chỉnh chiến lược tối ưu hóa nội dung phù hợp hơn.

1. Tóm tắt những điểm chính của nghiên cứu

1.1. Mức độ trùng lặp nguồn tham khảo giữa các công cụ

  • ChatGPT và Perplexity có tỉ lệ trùng lặp tên miền trích dẫn cao nhất, đạt 25,19%.
  • ChatGPT và Google AIO cũng có mức độ tương đồng cao (21,26%).
  • Bing Copilot có mức trùng lặp thấp nhất, chỉ 9,81% với Google AIO, 11,97% với Perplexity và 13,95% với ChatGPT.

Điều này cho thấy mỗi công cụ có “gu” chọn nguồn rất riêng, ảnh hưởng trực tiếp đến chất lượng và định hướng nội dung phản hồi.

1.2. Độ tuổi của các tên miền được trích dẫn

  • Bing Copilot ưu tiên trích dẫn từ các tên miền “trẻ”, mới dưới 5 năm (chiếm 18,85%).
  • Google AIO lại thiên về các nguồn có tuổi đời cao (49,21% tên miền trên 15 năm).
  • ChatGPT cũng ưu tiên nguồn cũ (45,8% > 15 năm), nhưng vẫn mở rộng sang các nguồn mới (11,99% < 5 năm).
  • Perplexity thường trích dẫn các website có tuổi đời trung bình từ 10–15 năm (26,16%).

Như vậy, nếu bạn sở hữu website còn khá mới, khả năng cao bạn sẽ có cơ hội xuất hiện trong kết quả của Bing Copilot hoặc ChatGPT, hơn là Google AIO.

1.3. Độ dài và đặc điểm nội dung phản hồi

Công cụ

Độ dài trung bình

Ngôn ngữ

Mức độ chủ quan

Độ phức tạp ngữ pháp

Trung bình số link

Bing Copilot

398 ký tự

Từ vựng đa dạng, đơn giản

0.45 (vừa phải)

Thấp

3.13 links

Google AIO

997 ký tự

Lặp từ nhiều, vốn từ hạn chế

0.48

Thấp

9.26 links

Perplexity

1.310 ký tự

Thường lặp ý, thiên cảm tính

0.50 (cao nhất)

Cao nhất

5.01 links

ChatGPT

1.686 ký tự

Ngôn ngữ đa dạng, thiên về dữ liệu

0.44 (khách quan nhất)

Cao

10.42 links

Nhìn vào bảng trên, ta thấy Chat GPTPerplexity tạo ra các câu trả lời dài, phức tạp hơn, dùng nhiều nguồn hơn so với BingAIO. Trong khi đó, Bing Copilot ngắn gọn, dễ hiểu, nhưng ít liên kết trích dẫn còn Google AIO thì có nội dung trung bình, nguồn trích dẫn khá đầy đủ.

1.4. Mức độ tương đồng về ngữ nghĩa

  • ChatGPTPerplexity có mức tương đồng ngữ nghĩa cao nhất (0.82), nghĩa là phần lớn câu trả lời từ hai công cụ này mang sắc thái và nội dung gần giống nhau.
  • Cả hai cũng có xu hướng trích dẫn các trang có lượng truy cập thấp: 47,31% với ChatGPT và 44,88% với Perplexity. Điều này quan trọng với các SEOer muốn “ranking” nhanh mà không cần đua top với các trang lớn.

1.5. Website được trích dẫn nhiều nhất

  • YouTube là trang được trích dẫn phổ biến nhất trong câu trả lời của ChatGPT (11,30%), Perplexity (11,11%) và Google AIO (6,31%).
  • Bing Copilot hầu như không dùng YouTube (chỉ 0,86%), mà lại ưu ái WikiHow – chiếm 6,33% nguồn dẫn đầu.

Lưu ý:

Nghiên cứu này nhằm khám phá cách các công cụ tìm kiếm AI như Google AIO, Bing Copilot, ChatGPTPerplexity (có bật tìm kiếm) phản hồi truy vấn và lựa chọn nguồn tham khảo.

Tuy nhiên, kết quả có thể thay đổi tùy theo từ khóa và thời điểm phân tích. Dữ liệu này được thu thập trước khi Google hoàn tất bản cập nhật Core Update, thời điểm mà sau đó giới SEO ghi nhận AIO bắt đầu xuất hiện cho khoảng 80% truy vấn.

Đây là một cách diễn giải kết quả, và chắc chắn còn nhiều hướng phân tích khác cũng hợp lý.

2. Phân tích nguồn: Số lượng liên kết, trang web được trích dẫn, mức độ trùng lặp tên miền

2.1. Số lượng liên kết trong câu trả lời AI

Một trong những yếu tố thể hiện mức độ “có cơ sở” của câu trả lời từ các công cụ tìm kiếm AI là số lượng liên kết được chèn vào mỗi phản hồi. Kết quả nghiên cứu cho thấy có sự khác biệt đáng kể giữa các công cụ:

  • ChatGPT: Trung bình 10.42 liên kết trong mỗi câu trả lời – đây là con số cao nhất trong 4 công cụ, cho thấy Chat GPT có xu hướng cung cấp nội dung được hỗ trợ mạnh mẽ bởi nguồn tham khảo. Điều này phù hợp với đặc điểm của Chat GPT khi được bật tính năng tìm kiếm (Search GPT), với độ ưu tiên cao cho việc tổng hợp và dẫn chứng thông tin.
  • Google AIOs (AI Overviews): Trung bình 9.26 liên kết mỗi phản hồi – cũng là một con số khá cao, phản ánh đúng triết lý của Google trong việc ưu tiên những câu trả lời có thể kiểm chứng, nhiều nguồn và “có vẻ khách quan”.
  • Perplexity: Trung bình 5.01 liên kết, một mức độ trích nguồn ở mức trung bình. Perplexity có xu hướng chọn lọc nguồn kỹ và trích vừa đủ để hỗ trợ nội dung, không quá dày đặc như ChatGPT hay Google AIO.
  • Bing Copilot: Chỉ trung bình 3.13 liên kết, thấp nhất trong nhóm phản ánh cách tiếp cận đơn giản, súc tích và ít “bảo vệ quan điểm” hơn so với các đối thủ. Đồng thời, Bing Copilot cũng là công cụ có độ dài câu trả lời ngắn nhất, trung bình chỉ 398 ký tự, cho thấy định hướng trả lời nhanh, trực diện, ít tầng lớp thông tin.
Dữ liệu về số lượng liên kết trong câu trả lời AI
Dữ liệu về số lượng liên kết trong câu trả lời AI

Nếu bạn đang triển khai SEO content hoặc xây dựng nội dung hướng đến AI Search, việc hiểu “tính cách” từng công cụ là cực kỳ quan trọng. Ví dụ:

  • Viết cho ChatGPT hoặc Google AIO: Ưu tiên nội dung chuyên sâu, có nhiều liên kết nội bộ/ngoại bộ, có cấu trúc rõ ràng và dễ crawl.
  • Viết cho Bing Copilot: Tập trung nội dung ngắn gọn, dễ đọc, sử dụng ngôn ngữ đơn giản, mang tính giải pháp thực tiễn, và tránh lan man.
  • Viết cho Perplexity: Cân bằng giữa chiều sâu và độ ngắn gọn, ưu tiên câu trả lời cô đọng nhưng có luận điểm rõ ràng, dẫn nguồn từ các domain có độ uy tín trung bình đến cao.

Không có gì bất ngờ khi ChatGPT là công cụ tạo ra câu trả lời dài nhất (trung bình 1.686 ký tự) cũng là công cụ có số lượng liên kết tham khảo nhiều nhất. Tương tự, Bing Copilot, với câu trả lời ngắn nhất (chỉ khoảng 398 ký tự), lại có số lượng liên kết ít nhất. Điều này khá logic: nội dung dài thường cần dẫn chứng nhiều hơn để tăng tính thuyết phục.

Tuy nhiên, mối quan hệ này lại không đúng hoàn toàn khi so sánh giữa Google AIOsPerplexity. Dù câu trả lời từ AIOs ngắn hơn Perplexity (977 ký tự so với 1.310 ký tự), nhưng AIO lại dẫn nhiều liên kết gần gấp đôi (9.26 so với 5.01). Điều này cho thấy Google ưu tiên chiều sâu của nguồn hơn độ dài nội dung, tức là: ngắn nhưng có dẫn chứng rõ ràng.

Chúng ta sẽ phân tích sâu hơn về độ dài nội dung và phong cách trình bày trong phần tiếp theo của nghiên cứu là phân tích nội dung (Content Analysis).

So sánh độ dài trong câu phản hồi của AI và số lượng nguồn được sử dụng

Để kiểm chứng mối quan hệ giữa độ dài của câu trả lời và số lượng liên kết được sử dụng, nhóm nghiên cứu đã áp dụng hệ số tương quan Pearson – một công cụ thống kê giúp đo mức độ tương quan giữa hai tập dữ liệu.

Cách hiểu nhanh hệ số Pearson:

  • +1: Hai biến tăng cùng nhau (tương quan thuận tuyệt đối).
  • 0: Không có mối quan hệ.
  • -1: Một biến tăng thì biến còn lại giảm (tương quan nghịch tuyệt đối).

Dưới đây là hệ số tương quan trung bình mà nhóm nghiên cứu ghi nhận được giữa độ dài câu trả lời (tính theo số từ) và số lượng liên kết trong mỗi phản hồi của từng công cụ:

Công cụ AI Search

Hệ số tương quan

Diễn giải nhanh

Bing Copilot

0.16

Có mối tương quan thuận nhẹ

Google AIO

0.38

Mức tương quan thuận vừa phải

Perplexity

-0.03

Gần như không có mối tương quan

ChatGPT

0.21

Có mối tương quan thuận nhẹ

So sánh độ dài trong câu phản hồi của AI và số lượng nguồn được sử dụng
So sánh độ dài trong câu phản hồi của AI và số lượng nguồn được sử dụng

Điều này có ý nghĩa gì với người làm nội dung và SEO?

  • Với Google AIO, việc đầu tư vào nguồn tham khảo uy tín vẫn là chiến lược quan trọng, ngay cả khi nội dung ngắn.
  • Perplexity hoạt động “khác người”: không phụ thuộc vào độ dài để xác định số lượng nguồn dẫn. Nghĩa là bạn cần tập trung tối ưu nội dung logic và đúng truy vấn, hơn là chỉ chăm chăm chèn nhiều link.
  • ChatGPTBing Copilot có mối liên hệ nhẹ giữa độ dài và số link – nội dung càng dài thì càng nên bổ sung thêm nguồn, nhưng đừng biến nó thành danh sách link khô khan.

Tùy thuộc vào công cụ AI Search mà bạn muốn tối ưu (Google AIO, ChatGPT, Bing hay Perplexity), cách xây dựng nội dung và chiến lược trích dẫn cũng cần điều chỉnh theo. Đừng áp dụng một công thức chung cho tất cả, AI search không giống Google truyền thống, và mỗi “cỗ máy tìm kiếm AI” lại có một “gu” riêng biệt.

Trong số các công cụ tìm kiếm AI, Google AIOs thể hiện hệ số tương quan cao nhất (0.38) giữa độ dài câu trả lờisố lượng liên kết được trích dẫn. Tuy nhiên, 0.38 vẫn chỉ được xem là tương quan thuận ở mức trung bình nghĩa là: càng trả lời dài thì càng có xu hướng thêm nhiều liên kết, nhưng không phải lúc nào cũng đúng tuyệt đối.

Đứng thứ hai là ChatGPT, với hệ số tương quan 0.21, cho thấy có mối liên hệ yếu, nhưng vẫn có thể quan sát thấy một mô hình: nội dung dài hơn thì thường có nhiều dẫn chứng hơn.

Bing Copilot cũng chỉ đạt mức tương quan yếu (0.16), trong khi Perplexity gần như không có mối liên hệ nào đáng kể (hệ số chỉ -0.03). Điều này cho thấy Perplexity có chiến lược riêng, ưu tiên duy trì số lượng nguồn cố định, thay vì phụ thuộc vào độ dài câu trả lời.

Thực tế, Perplexity thường xuyên trích dẫn đúng 5 nguồn cho mỗi câu trả lời – gần như một công thức. Trong khi đó, Google AIO linh hoạt hơn nhiều: có khi chỉ dẫn 2 link, nhưng cũng có lúc lên đến 53 link, tùy vào độ phức tạp của truy vấn và nhu cầu chứng minh nội dung.

Tần suất số lượng liên kết được dùng trong câu trả lời của từng công cụ

Bing Copilot: “Tối giản và đủ dùng”

Bing Copilot theo đuổi chiến lược tối giản hóa trích dẫn, tập trung vào việc trả lời nhanh gọn với số nguồn vừa đủ để tạo độ tin cậy. Phổ biến nhất là:

  • 2 liên kết: 573 trường hợp
  • 3 liên kết: 326 trường hợp
  • 5 liên kết: 276 trường hợp

Đặc biệt, có 22 trường hợp Bing không trích dẫn bất kỳ nguồn nào – có thể do công cụ sử dụng cơ sở dữ liệu nội bộ để đưa ra câu trả lời, không cần dẫn chứng bên ngoài.

Google AIO: “Chi tiết và linh hoạt”

Google AIO lại có kiểu phân phối “rộng hơn” về mặt số lượng liên kết. Ba mốc phổ biến nhất là:

  • 7 nguồn: 164 trường hợp
  • 8 nguồn: 160 trường hợp
  • 6 nguồn: 135 trường hợp

Có thể thấy, Google định hướng câu trả lời theo kiểu bổ sung đầy đủ dẫn chứng để tăng mức độ thuyết phục, tương tự như cách viết bài SEO chất lượng cao hiện nay.

Google định hướng câu trả lời theo kiểu bổ sung đầy đủ dẫn chứng
Google định hướng câu trả lời theo kiểu bổ sung đầy đủ dẫn chứng

ChatGPT: “Thích trả lời toàn diện”

ChatGPT thể hiện rõ xu hướng đưa ra câu trả lời đầy đủ, có hệ thống, với tần suất trích dẫn cao hơn đáng kể:

  • 9 liên kết: 406 trường hợp
  • 10 liên kết: 340 trường hợp
  • 8 liên kết: 282 trường hợp

Đáng chú ý, trong một số trường hợp, số liên kết trong một phản hồi của ChatGPT lên đến 24 link – điều này phản ánh rõ quan điểm “càng nhiều thông tin, càng tăng độ tin cậy”.

Perplexity: “Ổn định như một chiếc máy”

Điểm đặc biệt nhất của Perplexity là: hầu như lúc nào cũng dùng đúng 5 nguồn. Cụ thể, có đến 1.980 phản hồi sử dụng chính xác 5 liên kết. Đây là công cụ có phong cách trích dẫn đồng nhất và có chiến lược rõ ràng, khác biệt hoàn toàn với các công cụ còn lại vốn linh hoạt hoặc mang tính tùy biến cao.

2.2. Phân tích traffic, từ khóa, backlink và domain trỏ về các URL được trích dẫn bởi AI

Trong nghiên cứu này, nhóm phân tích đã sử dụng công cụ SE Ranking – Competitor Analysis để kiểm tra chất lượng các URL được AI trích dẫn làm nguồn tham khảo. Tổng cộng có 46.299 liên kết xuất hiện trong các câu trả lời của AI trên tất cả các công cụ. Trong số đó, có 33.508 URL (chiếm 72,37%) có dữ liệu về lưu lượng truy cập tự nhiên (organic traffic).

Trong số các URL có dữ liệu traffic:

  • 29.271 URL (tương đương 87,34%) nhận được traffic tự nhiên từ Google – nghĩa là đang được index và xếp hạng trên kết quả tìm kiếm thông thường.
  • Ngược lại, có tới 4.237 URL (khoảng 12,64%) không nhận được bất kỳ lượt truy cập nào từ Google, có thể do nội dung yếu, SEO chưa được triển khai, hoặc đơn giản là không đủ chất lượng để lên top.

Phân bố traffic: Nhiều nguồn được AI trích dẫn nhưng không có traffic

Khi phân tích sâu hơn về phân bổ traffic của các URL được AI sử dụng, kết quả gây ngạc nhiên:

  • Gần một nửa (46,59%) trong số đó tương đương 15.613 URL chỉ nhận được từ 0 đến 50 lượt truy cập/tháng. Trong nhóm này, có 4.237 URL hoàn toàn không có traffic.
  • 13,51% URL có lượng truy cập ổn hơn, dao động trong khoảng 1.000 đến 10.000 lượt/tháng, đây là nhóm trung bình, có thể xem là nguồn khá đáng tin trong ngành.
  • Tuy nhiên, chỉ có 0,38% URL thật sự “top traffic” nghĩa là có trên 100.000 lượt truy cập/tháng. Đây là các siêu nguồn như Wikipedia, Forbes, hoặc các trang chuyên ngành cực mạnh.
Traffic của các URL được AI trích dẫn trả lời
Traffic của các URL được AI trích dẫn trả lời

Về từ khóa, dữ liệu cho thấy:

  • 28,08% các URL được AI trích dẫn đang xếp hạng cho 1.000–10.000 từ khóa trên kết quả tìm kiếm Google. Đây là những trang có nội dung phong phú, được tối ưu tốt và thường là những trang chuyên sâu, có uy tín.
  • Ngược lại, 12,74% URL chỉ xếp hạng cho dưới 50 từ khóa. Đây thường là các nội dung mang tính chuyên biệt cao, phục vụ một truy vấn cụ thể hoặc lĩnh vực ngách.
Số lượng từ khoá đang được xếp hạng của URL
Số lượng từ khoá đang được xếp hạng của URL

Dữ liệu về Referring domain được thu thập từ công cụ Backlink Checker cho thấy:

  • 64,26% URL chỉ có tối đa 5 referring domains tức là chỉ có rất ít website khác trỏ backlink đến. Điều này hoàn toàn hợp lý, vì hầu hết các nội dung mà AI chọn để tham khảo là dạng thông tin (informational) như blog post hoặc bài phân tích, vốn không dễ thu hút nhiều backlink tự nhiên.
  • Khoảng 27% URL có từ 5 đến 50 referring domains, đây có thể xem là nhóm “trung bình khá” về độ uy tín backlink.
Số lượng referring domain của từng URL được các công cụ LLLM trích dẫn
Số lượng referring domain của từng URL được các công cụ LLLM trích dẫn

Phân bố backlink cũng có xu hướng tương tự:

  • 53,5% URL chỉ có từ 0 đến 5 backlink.
  • 29,45% URL có từ 5 đến 50 backlink, một con số ổn để thể hiện rằng trang đó có tín hiệu SEO nhất định, nhưng vẫn không thuộc nhóm “authority site” (trang có thẩm quyền cao).

Lưu ý: Trong tổng số 46.299 URL được AI trích dẫn, chỉ có 35.043 URL (tương đương 75,67%) là có dữ liệu đầy đủ về backlink và referring domain để phân tích.

Phần lớn các đường link được trích dẫn bởi các công cụ tìm kiếm AI đều có lưu lượng truy cập tự nhiên
Phần lớn các đường link được trích dẫn bởi các công cụ tìm kiếm AI đều có lưu lượng truy cập tự nhiên

Dữ liệu cho thấy phần lớn các đường link được trích dẫn bởi các công cụ tìm kiếm AI như ChatGPT hay Perplexity đều có lưu lượng truy cập tự nhiên (organic traffic) từ kết quả tìm kiếm Google. Tuy nhiên, phần lớn trong số đó lại có lượng traffic khá khiêm tốn.

Điều này cho thấy các công cụ AI không chỉ ưu tiên các nguồn nội dung phổ biến, có chỉ số SEO mạnh, mà còn trích dẫn những trang ít nổi bật hơn miễn là nội dung phù hợp với truy vấn. Nói cách khác, tiêu chí lựa chọn nguồn của AI có xu hướng đặt trọng tâm vào mức độ liên quan của nội dung hơn là sức mạnh SEO truyền thống.

Tuy nhiên, cũng cần lưu ý rằng kết quả này có thể chịu ảnh hưởng từ bộ từ khóa được sử dụng trong nghiên cứu, vì có những chủ đề vốn dĩ ít cạnh tranh và có lưu lượng tìm kiếm thấp.

Phân tích các chỉ số như traffic, số từ khóa xếp hạng, số lượng backlink và referring domains cho thấy có sự phân cực mạnh giữa các URL được trích dẫn:

  • Một nhóm nhỏ các URL có hiệu suất SEO vượt trội, sở hữu lượng lớn traffic, nhiều từ khóa xếp hạng và hệ thống backlink tốt.
  • Còn lại là số đông các URL có hiệu suất thấp, traffic ít, từ khóa giới hạn và gần như không có backlink.

Hiện tượng này phản ánh một mô hình phân phối hai cực (bimodal distribution): một nhóm rất mạnh và một nhóm rất yếu, trong khi số lượng URL ở mức trung bình là khá ít.

Cách ChatGPT và Perplexity trích dẫn nguồn: so sánh cụ thể

ChatGPT

  • Tổng số link được trích dẫn: 20.811
  • Có dữ liệu phân tích: 15.520 URL (74,57%)
  • Trong đó, 13.564 URL (87,4%) có organic traffic > 0

Về lượng truy cập:

  • 47,31% URL có traffic rất thấp (từ 0 đến 50 lượt truy cập/tháng)
  • Chỉ 0,48% URL có traffic lớn (trên 100.000 lượt truy cập/tháng)

Về số lượng từ khóa xếp hạng trên Google:

  • 15,45% URL xếp hạng cho 0–50 từ khóa (nội dung ngách hoặc ít tìm kiếm)
  • 25,59% URL xếp hạng cho 1.000–10.000 từ khóa (nội dung chất lượng, được tối ưu tốt)
  • 0,15% URL xếp hạng cho hơn 100.000 từ khóa

Perplexity

  • Tổng số link được trích dẫn: 9.999
  • Có dữ liệu phân tích: 6.714 URL (67,15%)
  • Trong đó, 6.022 URL (89,69%) có organic traffic > 0

Về lượng truy cập:

  • 44,88% URL có traffic rất thấp (0–50 lượt truy cập/tháng)

Về số lượng từ khóa xếp hạng:

  • 9,76% URL xếp hạng cho 0 – 50 từ khóa
  • 28,84% URL xếp hạng cho 1.000 – 10.000 từ khóa
  • 0,01% URL xếp hạng cho hơn 100.000 từ khóa
Các công cụ tìm kiếm AI đang vận hành theo một logic khác biệt so với SEO truyền thống
Các công cụ tìm kiếm AI đang vận hành theo một logic khác biệt so với SEO truyền thống

Trong số các URL được trích dẫn bởi ChatGPT, có 1.956 liên kết (chiếm 12,6%) không nhận được bất kỳ lượng truy cập nào từ Google. Con số tương ứng với Perplexity là 692 liên kết (10,3%). Điều đáng chú ý là dù không có traffic, những liên kết này vẫn được các công cụ AI đánh giá là “phù hợp” với truy vấn.

Điều này cho thấy rằng các công cụ tìm kiếm AI đang vận hành theo một logic khác biệt so với SEO truyền thống. Chúng có khả năng “đọc hiểu” giá trị thực sự của nội dung – kể cả khi nội dung đó chưa có độ phủ rộng hay sức mạnh từ hệ thống backlink.

Khi phân tích hệ thống backlink, phần lớn các URL được trích dẫn bởi cả ChatGPT và Perplexity đều có rất ít referring domains (tên miền trỏ liên kết đến). Cụ thể 91,88% các URL mà ChatGPT trích dẫn có dưới 50 referring domains, còn Perplexity cao hơn với 92,78%

Điều này củng cố thêm nhận định rằng AI không bị phụ thuộc vào chỉ số SEO offpage như backlink hay domain authority khi chọn nguồn trích dẫn. Thay vào đó, nội dung – nếu thật sự liên quan, rõ ràng, và có giá trị – vẫn có thể được ưu tiên.

2.3. Những website được trích dẫn nhiều nhất bởi các công cụ AI

YouTube là cái tên chiếm ưu thế rõ rệt:

  • ChatGPT trích dẫn YouTube chiếm 11,3%
  • Perplexity: 11,11%
  • Google AIOs (tính năng AI tổng hợp của Google): 6,31%

Điều này phản ánh xu hướng các công cụ AI ưu tiên nội dung video như một nguồn tham khảo bổ sung, phù hợp với hành vi người dùng hiện đại. Tuy nhiên, Bing Copilot lại ít trích dẫn YouTube, chỉ chiếm 0,86%.

Thay vào đó, Bing Copilot lại có xu hướng trích dẫn WikiHow nhiều nhất (6,33%). Đây là dấu hiệu cho thấy Bing đang theo đuổi chiến lược cung cấp câu trả lời mang tính hành động dạng hướng dẫn từng bước, dễ áp dụng.

Cả Bing Copilot và Google AIOs đều thường xuyên trích dẫn Indeed (2,5%) khi câu hỏi liên quan đến việc làm, nghề nghiệp.

Đặc biệt, Google AIO là nền tảng duy nhất trong nhóm nghiên cứu này có LinkedIn nằm trong top 10 website được trích dẫn nhiều nhất (2,77%). Điều này cho thấy Google có xu hướng ưu tiên các nguồn nội dung chuyên nghiệp, mang tính xác thực cao trong lĩnh vực nghề nghiệp và kinh doanh.

Ngoài ra, Google cũng thường xuyên dẫn nguồn từ các nền tảng cộng đồng như Quora (2,68%) và Reddit (1,24%). Đây là một điểm thú vị, cho thấy Google đang tích hợp cả yếu tố “trải nghiệm người dùng” và tri thức cộng đồng vào quá trình tạo nội dung AI.

Những website được trích dẫn nhiều nhất bởi các công cụ AI
Những website được trích dẫn nhiều nhất bởi các công cụ AI

Trong số các công cụ AI được nghiên cứu, Perplexity là nền tảng duy nhất thường xuyên trích dẫn Moodle – một hệ thống quản lý học tập mã nguồn mở phổ biến trong giới giáo dục. Moodle chiếm 4,08% tổng số liên kết mà Perplexity sử dụng, chỉ đứng sau YouTube (11,11%). Điều này cho thấy Perplexity có xu hướng ưu tiên các nguồn nội dung học thuật và tài liệu phục vụ học tập.

Ngoài Moodle, Perplexity cũng thường xuyên tham chiếu các website chuyên biệt như:

  • GitHub – nền tảng dành cho developer
  • Instructables – website hướng dẫn DIY và kỹ thuật
  • Markdown Guide – tài liệu hướng dẫn định dạng markdown

Đặc biệt, 20% tên miền nằm trong top 10 website được Perplexity trích dẫn nhiều nhất là những nền tảng liên quan trực tiếp đến AI, bao gồm Jasper.ai và Studioglobal.ai. Điều này phản ánh một định hướng rõ ràng: Perplexity đang phục vụ các truy vấn chuyên môn, đặc biệt là trong các lĩnh vực kỹ thuật và công nghệ.

Trong khi đó, ChatGPT lại có xu hướng ưu ái nội dung do người dùng tạo (user-generated content). Top 10 trang được ChatGPT trích dẫn nhiều nhất bao gồm:

  • YouTube: 11,3%
  • Reddit: 7,37%
  • Wikipedia: 1,95%
  • TikTok: gần 1%

Ngoài ra, ChatGPT cũng dẫn các nguồn báo chí có độ tin cậy cao như The Times (0,66%) và The Guardian (0,48%), cũng như nền tảng chuyên ngành như Investopedia (0,58%) và Microsoft (0,49%).

ChatGPT cũng dẫn các nguồn báo chí có độ tin cậy cao
ChatGPT cũng dẫn các nguồn báo chí có độ tin cậy cao

Khi so sánh cách phân bổ domain (tên miền được trích dẫn), có thể thấy ChatGPT và Perplexity tập trung vào một nhóm nhỏ các nguồn phổ biến, trong khi Google AIO và Bing Copilot phân bổ trích dẫn đều hơn giữa nhiều nguồn.

Cụ thể:

  • Top 3 tên miền được trích dẫn nhiều nhất chiếm:
  • 20,63% tổng nguồn của ChatGPT
  • 17,07% tổng nguồn của Perplexity
  • 12,03% của Google AIOs
  • Chỉ 9,69% với Bing Copilot

Từ đó có thể thấy các nền tảng AI có logic đánh giá và chọn lọc nguồn khác nhau: có nền tảng ưu tiên tính phổ biến, có nền tảng lại cố gắng đa dạng hóa nguồn dẫn.

Không có gì bất ngờ khi YouTube là tên miền được trích dẫn nhiều nhất trong tất cả các công cụ AI được phân tích.

Cả ChatGPT và Perplexity đều sử dụng YouTube như một nguồn tham khảo phổ biến, đặc biệt là trong các câu trả lời có hướng dẫn trực quan. Ví dụ:

  • AI Overviews (Google) thường gợi ý video trên YouTube và thậm chí chỉ rõ timestamp (thời điểm cụ thể trong video). Tuy nhiên, người dùng vẫn cần truy cập YouTube để xem.
  • ChatGPT tích hợp trực tiếp video hoặc nội dung hình ảnh vào câu trả lời, giúp người dùng dễ hình dung hơn.

YouTube được trích dẫn nhiều nhất ở các ngành sau:

  • Trò chơi (Games): 475 lần
  • Giải trí, sở thích (Hobbies and Leisure): 434 lần
  • Phương tiện, xe cộ (Vehicles): 391 lần
  • Thể thao (Sports): 348 lần

Reddit, Wikipedia, Quora và LinkedIn – Mỗi nền tảng có vai trò riêng

  • Reddit: ChatGPT dẫn Reddit nhiều nhất (1.535 lần). Dù Google AIOs cũng trích dẫn Reddit nhưng tổng số chỉ là 135 lần. Những lĩnh vực mà ChatGPT thường tham chiếu Reddit nhiều nhất là:
  • Nhà cửa & sân vườn (Home and Garden): 101 lần
  • Giải trí & sở thích: 97 lần
  • Thể thao: 95 lần
  • Wikipedia: Các nền tảng AI đều trích dẫn Wikipedia khá đồng đều. Tuy nhiên, ChatGPT vẫn là công cụ tham chiếu nhiều nhất. Wikipedia xuất hiện nhiều trong các lĩnh vực kiến thức khách quan như:
  • Tài chính (Finance): 38 lần
  • Công nghiệp nặng & kỹ thuật: 39 lần
  • Khoa học & giáo dục: 28 lần
  • Quora: Hầu như chỉ có Google AIOs sử dụng Quora như một nguồn thông tin tham khảo, tập trung vào các ngành:
  • Cộng đồng & xã hội (Community and Society): 55 lần
  • Phong cách sống (Lifestyle): 35 lần
  • Nhà cửa & sân vườn: 24 lần
  • LinkedIn: Đây là nền tảng chỉ được Google AIOs trích dẫn khi xử lý các truy vấn mang tính chuyên nghiệp, kinh doanh. Những lĩnh vực LinkedIn được trích dẫn nhiều nhất:
  • Việc làm & nghề nghiệp: 51 lần
  • Dịch vụ doanh nghiệp & khách hàng: 33 lần
  • Tài chính: 16 lần

Chúng tôi đã kiểm tra mức độ xuất hiện của các tên miền (domain) được một công cụ AI trích dẫn trong kết quả của các công cụ AI khác. Tỷ lệ phần trăm càng cao, đồng nghĩa với việc các công cụ này càng có nhiều tên miền chung trong nguồn tham khảo của mình.

Cụ thể, tỷ lệ trùng lặp tên miền được trích dẫn giữa các công cụ AI như sau:

  • Bing Copilot và Google AIO: 9,81%
  • Perplexity và Bing Copilot: 11,97%
  • Bing Copilot và ChatGPT: 13,95%
  • Perplexity và Google AIO: 18,52%
  • Google AIO và ChatGPT: 21,26%
  • Perplexity và ChatGPT: 25,19%
Tỷ lệ phần trăm càng cao, đồng nghĩa với việc các công cụ này càng có nhiều tên miền chung trong nguồn tham khảo
Tỷ lệ phần trăm càng cao, đồng nghĩa với việc các công cụ này càng có nhiều tên miền chung trong nguồn tham khảo

Trong đó, Perplexity và ChatGPT có mức độ trùng lặp cao nhất, với hơn 25% tên miền được tham khảo giống nhau. Điều này khá thú vị khi mà trong top những website được trích dẫn nhiều nhất, chỉ có khoảng 20% là trùng nhau giữa hai nền tảng này.

Google AI Overviews và ChatGPT cũng có tỷ lệ trùng lặp khá cao (21,26%), cho thấy cách thức lấy nguồn dữ liệu của hai nền tảng này khá tương đồng. Trong khi đó, tỷ lệ trùng lặp giữa Google AIO và Perplexity thấp hơn chút (18,52%).

ChatGPT có mức độ giao thoa cao nhất với các công cụ AI còn lại, điều này có thể cho thấy ChatGPT sử dụng tập hợp nguồn tham khảo đa dạng nhất hoặc áp dụng thuật toán cân bằng nhất để phân tích và chọn lọc kết quả. Đồng thời, ChatGPT cũng dẫn nhiều nguồn nhất trong câu trả lời của mình, điều này ảnh hưởng trực tiếp đến kết quả.

Ngược lại, Bing Copilot là công cụ có tỷ lệ trùng lặp thấp nhất với các công cụ khác, cho thấy cách tiếp cận lựa chọn nguồn tham khảo của Bing Copilot rất khác biệt. Tỷ lệ trùng lặp giữa Bing Copilot và Google AI Overviews chỉ khoảng 9,81%, thể hiện rõ sự khác biệt trong chiến lược trích dẫn thông tin giữa Microsoft và Google. Tỷ lệ này giữa Bing Copilot và Perplexity cũng chỉ ở mức 11,97%.

Các tên miền duy nhất được AI trích dẫn

Chúng tôi xác định một tên miền là “duy nhất” hoặc “độc quyền” nếu nó chỉ được trích dẫn bởi một trong các công cụ AI mà chúng tôi phân tích.

Dữ liệu cho thấy ChatGPT có số lượng tên miền duy nhất lớn nhất với 4.034 tên miền. Điều này có thể giải thích bởi ChatGPT sử dụng lượng nguồn tham khảo lớn nhất so với các công cụ AI còn lại. Nó thường trích dẫn nhiều nguồn trong câu trả lời mà các AI khác không dùng đến.

Các con số về tên miền duy nhất ở các công cụ AI còn lại như sau:

  • Bing Copilot: 1.301 tên miền
  • Google AIO: 2.909 tên miền
  • Perplexity: 2.067 tên miền
  • ChatGPT: 4.034 tên miền
Các tên miền duy nhất được AI trích dẫn
Các tên miền duy nhất được AI trích dẫn

Google AIO xếp thứ hai, tiếp theo là Perplexity và Bing Copilot. Điều đáng chú ý là sự khác biệt giữa số lượng tên miền duy nhất và mức độ ảnh hưởng thực tế của chúng trên trang kết quả tìm kiếm (SERPs). Ví dụ, mặc dù Google AIO liên kết đến rất nhiều tên miền mà các công cụ AI khác không dùng đến (2.909 tên miền), nhưng chỉ có Quora.com được trích dẫn thường xuyên (293 lần), còn các nguồn khác thì xuất hiện rất ít.

Top 5 tên miền duy nhất được trích dẫn bởi mỗi công cụ AI

Top 5 tên miền duy nhất được trích dẫn bởi mỗi công cụ AI
Top 5 tên miền duy nhất được trích dẫn bởi mỗi công cụ AI

Khi so sánh 5 tên miền độc quyền được mỗi công cụ AI trích dẫn với top 10 website được trích dẫn nhiều nhất chung cho mỗi công cụ, ta thấy rất nhiều tên miền phổ biến xuất hiện ở nhiều công cụ AI khác nhau. Điều này cho thấy có một bộ nguồn tin cậy chung mà các nền tảng này cùng dựa vào. Tuy nhiên, vẫn có một số ngoại lệ:

  • Moodle.org: Chỉ được Perplexity trích dẫn và là một trong top 10 nguồn thường xuyên của nó (chuyên về nội dung giáo dục và học tập).
  • Thetimes.co.uk: Độc quyền của ChatGPT.
  • Quora.com: Chỉ được Google AIO trích dẫn và đứng thứ 3 trong top các website được liên kết nhiều nhất của Google AIO.
  • Jasper.ai: Độc quyền của Perplexity và là website thứ 3 được nhắc đến nhiều nhất của công cụ này.

Tên miền trùng lặp trong câu trả lời AI

Trên 2.000 truy vấn được phân tích, kết quả cho thấy:

  • ChatGPT có 1.412 câu trả lời chứa ít nhất hai URL từ cùng một tên miền, đạt tỷ lệ trùng lặp cao nhất là 71,03%.
  • Google AIOs có 689 câu trả lời với tên miền trùng lặp, tỷ lệ 58,49%.
  • Perplexity có 501 câu trả lời với URL cùng tên miền, tỷ lệ 25,11%.
  • Bing Copilot có ít câu trả lời trùng lặp nhất, chỉ 203 trường hợp, tỷ lệ 13,47%.
Tên miền trùng lặp trong câu trả lời AI
Tên miền trùng lặp trong câu trả lời AI

Điều này cho thấy ChatGPT có xu hướng trích dẫn lại nhiều lần cùng một website trong câu trả lời của mình. Google AI Overviews cũng ưu tiên một số nguồn nhất định nhưng có sự đa dạng hơn ChatGPT. Perplexity phân phối nguồn tham khảo khá cân bằng, còn Bing là công cụ đa dạng nhất với lượng nguồn phong phú và trải rộng trên nhiều website khác nhau.

Độ tuổi của các tên miền được AI trích dẫn

Tuổi trung bình của các tên miền được trích dẫn theo thứ tự:

  • ChatGPT: 17 năm
  • Google AIO: 17 năm
  • Perplexity: 14 năm
  • Bing Copilot: 12 năm

Chúng ta có thể thấy rõ xu hướng ưu tiên theo nhóm tuổi tên miền, chia thành tên miền trẻ (dưới 5 năm) và tên miền già (trên 15 năm).

Tỷ lệ tên miền trẻ (dưới 5 năm) được trích dẫn:

  • Bing Copilot: 18,85%
  • ChatGPT: 11,99%
  • Perplexity: 8,53%
  • Google AIOs: 7,45%

Tỷ lệ tên miền già (trên 15 năm) được trích dẫn:

  • Google AIOs: 49,21%
  • ChatGPT: 45,80%
  • Perplexity: 42,31%
  • Bing Copilot: 31,19%
Tỷ lệ tên miền già (trên 15 năm) được trích dẫn
Tỷ lệ tên miền già (trên 15 năm) được trích dẫn

Bing Copilot thường xuyên trích dẫn các tên miền trẻ hơn (dưới 5 năm) nhiều nhất, trong khi Google AIOs là công cụ trích dẫn ít nhất nhóm này. Ngược lại, Google AIOs có tỷ lệ trích dẫn các tên miền già cao nhất, gần một nửa số nguồn tham khảo của họ có tuổi trên 15 năm.

ChatGPT thể hiện cách tiếp cận khá đa dạng và đối lập:

  • Có tỷ lệ trích dẫn tên miền rất già cao (31,67% tên miền trên 20 năm tuổi).
  • Đồng thời, cũng đứng thứ hai về tỷ lệ trích dẫn tên miền rất trẻ (4,86% cho tên miền 0-3 năm).
  • Ngoài ra, ChatGPT rất ưa chuộng các tên miền trung niên: 5-10 năm (21,97%) và 10-15 năm (20,24%).

Điều này cho thấy với các kiến thức nền tảng, lịch sử hay thông tin đã được kiểm chứng lâu dài, ChatGPT ưu tiên các nguồn có độ tin cậy cao, được chứng minh theo thời gian.

Perplexity phân phối nguồn tham khảo khá cân bằng ở nhóm tuổi trung niên và già, với tỷ lệ trích dẫn cao nhất thuộc nhóm 10-15 năm tuổi (26,16%), cao hơn hẳn các công cụ khác. Các nhóm khác như 5-10 năm (23,11%), 15-20 năm (21,00%) và trên 20 năm (21,21%) cũng được Perplexity sử dụng nhiều. Tuy nhiên, tỷ lệ trích dẫn các tên miền trẻ nhất (0-3 năm) của Perplexity thấp nhất (3,32%).

Độ tuổi tên miền theo từng ngách (niche)

Các lĩnh vực có tỷ lệ tên miền trẻ (dưới 5 năm) thấp nhất:

  • Khoa học và Giáo dục: 5,60%
  • Luật và Chính phủ: 7,70%
  • Y tế: 8%
  • Máy tính, Điện tử và Công nghệ: 11%

Các lĩnh vực có tỷ lệ tên miền già (trên 20 năm) thấp nhất:

  • Thực phẩm và Đồ uống: 10,40%
  • Trò chơi (Games): 14%
Các lĩnh vực có tỷ lệ tên miền già (trên 20 năm) thấp nhất
Các lĩnh vực có tỷ lệ tên miền già (trên 20 năm) thấp nhất

Một số điểm nổi bật theo ngành:

  • Tài chính có tỷ lệ sử dụng tên miền già rất cao, khoảng 46% nguồn tham khảo có tuổi trên 20 năm. Trong khi đó, tên miền trẻ dưới 5 năm chỉ chiếm 13,5%. Điều này phản ánh rõ sự ưu tiên nguồn tin lâu đời, uy tín và có lịch sử trong ngành tài chính.
  • Luật và Chính phủ cũng có xu hướng tương tự, với 38% nguồn trên 20 năm tuổi và chỉ khoảng 7,7% là tên miền trẻ.
  • Việc làm và sự nghiệp có khoảng 35% nguồn trên 20 năm và 11,7% là tên miền dưới 5 năm.
  • Hobbies và Leisure lại ưu tiên các tên miền trung niên, chiếm đến gần 60% tổng nguồn tham khảo trong nhóm 5-10 năm và 10-15 năm.
  • Các lĩnh vực Thực phẩm và Đồ uống (59%) và Nhà cửa và Vườn (59%) cũng theo xu hướng tương tự, với sự áp đảo của các tên miền trung niên.

2.4. Top-level domains (TLDs) (tên miền chất lượng nhất) được liên kết trong các phản hồi của AI

Chúng tôi đã phân tích tổng cộng 46.299 URL và 15.181 website riêng biệt được các công cụ tìm kiếm AI trích dẫn, thuộc về 174 tên miền cấp cao khác nhau (Top-level domains – TLDs).

Dưới đây là danh sách 10 TLD được trích dẫn nhiều nhất trên tất cả các công cụ AI:

  • .com: 37.477 liên kết
  • .org: 3.270 liên kết
  • .uk: 960 liên kết
  • .edu: 737 liên kết
  • .gov: 607 liên kết
  • .net: 554 liên kết
  • .au: 428 liên kết
  • .ai: 348 liên kết
  • .co: 303 liên kết
  • .io: 283 liên kết

Bảng phân bố TLD theo từng công cụ AI

Bảng phân bố TLD theo từng công cụ AI
Bảng phân bố TLD theo từng công cụ AI

TLD .com dẫn đầu với tỷ lệ trích dẫn cao nhất trên mọi nền tảng AI. Cụ thể:

  • Bing Copilot: 85,85% liên kết thuộc .com
  • ChatGPT: 83,09%
  • Google AIOs: 78,55%
  • Perplexity: 76,18%

TLD .org đứng thứ hai, nhưng tỷ lệ trích dẫn khác nhau khá rõ:

  • Perplexity: 9,60%
  • ChatGPT: 6,64%
  • Google AIOs: 6,41%
  • Bing: 4,89%

TLD .uk phổ biến hơn ở Google AIOs (3,05%) và ChatGPT (2,27%), trong khi Perplexity (0,99%) và Bing (1,21%) ít sử dụng hơn. TLD .au được Google AIOs trích dẫn nhiều nhất (1,49%) nhưng dưới 0,8% ở các AI khác. TLD .ca cũng chủ yếu được Google AIOs (0,68%) và ChatGPT (0,30%) sử dụng.

Đáng chú ý, Perplexity có tỷ lệ trích dẫn TLD .ai khá cao (2,93%), thể hiện xu hướng ưu tiên các nguồn liên quan đến trí tuệ nhân tạo.

Phân bố TLD theo ngành nghề trong phản hồi AI

Những ngành nghề có sự đa dạng TLD lớn nhất bao gồm: Y tế (Health), Luật và Chính phủ (Law and Government), Khoa học và Giáo dục (Science and Education). Trong khi đó, các ngành như Ẩm thực (Food and Drink), Nhà cửa và Làm vườn (Home and Garden), Sở thích và Giải trí (Hobbies and Leisure) có tỷ lệ tập trung cao nhất vào TLD .com.

Có sự tương quan rõ ràng giữa chủ đề và loại tên miền. Ví dụ:

  • TLD .gov chiếm đến 11,50% trong lĩnh vực Luật và Chính phủ, phản ánh tính đặc thù và độ tin cậy cao của các nguồn nhà nước.
  • TLD .edu chiếm 7,91% trong ngành Khoa học và Giáo dục, phù hợp với các nguồn học thuật và nghiên cứu.

TLD .ai xuất hiện nhiều nhất trong nhóm Dịch vụ kinh doanh và người tiêu dùng (Business and Consumer Services) (2,02%) và Khoa học và Giáo dục (1,30%), phản ánh sự gia tăng ứng dụng AI trong các lĩnh vực này.

Ở lĩnh vực Game, TLD .gg chiếm tỷ lệ 2,97%, cao hơn đáng kể so với mặt bằng chung, chứng tỏ đặc thù riêng cho ngành game.

Một số TLD đặc thù xuất hiện theo từng ngành như:

  • .broadway (0,23%) chỉ xuất hiện trong lĩnh vực Nghệ thuật và Giải trí.
  • .pet (0,46%) và .fish (0,12%) thuộc về lĩnh vực Thú cưng và Động vật.
  • .bank (0,34%) trong ngành Tài chính.
  • .aero (0,19%) đặc trưng cho ngành Công nghiệp nặng và Kỹ thuật hàng không.

Lĩnh vực Máy tính, Điện tử và Công nghệ tăng tỷ lệ trích dẫn các TLD kỹ thuật như .io (1,58%), .app (0,42%) và .codes (0,33%), phản ánh rõ nét xu hướng công nghệ.

TLD địa phương và ngành nghề trong phản hồi AI

Về tên miền địa phương (các tên miền theo quốc gia như .uk, .de, .fr…), Perplexity và Google ưu tiên trích dẫn các nguồn địa phương hơn so với các công cụ khác:

  • Perplexity: 8,66%
  • Google AIOs: 8,18%
  • ChatGPT: 5,38%
  • Bing Copilot: 3,88%
Perplexity và Google ưu tiên trích dẫn các nguồn địa phương
Perplexity và Google ưu tiên trích dẫn các nguồn địa phương

Điều này cho thấy Perplexity và Google có xu hướng ưu tiên nguồn thông tin khu vực hoặc quốc gia, trong khi Bing ưu tiên tên miền toàn cầu hơn.

Về các tên miền chuyên ngành (như .health, .pet, .bank, .art, .training, .media…), Bing Copilot dẫn đầu một chút:

  • Bing Copilot: 0,53%
  • Perplexity: 0,51%
  • Google AIOs: 0,32%
  • ChatGPT: 0,25%
Tỷ lệ trích dẫn tên miền chuyên ngành này đều rất thấp
Tỷ lệ trích dẫn tên miền chuyên ngành này đều rất thấp

Tỷ lệ trích dẫn tên miền chuyên ngành này đều rất thấp, dưới 1%, nhưng Bing và Perplexity có xu hướng tham khảo các nguồn chuyên biệt hơn so với Google và ChatGPT, dù sự khác biệt không lớn.

YouTube và vai trò của nó trong các phản hồi của AI

YouTube nổi bật như một nguồn tham khảo quen thuộc trên hầu hết các công cụ tìm kiếm AI hiện nay. Cụ thể, ChatGPT tham chiếu YouTube trong khoảng 11,30% các câu trả lời, Perplexity cũng không kém cạnh với tỷ lệ 11,11%, còn Google AIOs thì sử dụng YouTube trong 6,31% các trường hợp. Riêng Bing Copilot lại là công cụ duy nhất tham khảo YouTube dưới 1% thời gian (chỉ khoảng 0,86%).

Đặc điểm trích dẫn nguồn của từng AI

ChatGPT

ChatGPT có xu hướng tạo ra các câu trả lời chứa rất nhiều tham chiếu, trung bình khoảng 10,42 liên kết mỗi phản hồi. Tuy nhiên, tỷ lệ trùng lặp tên miền (domain duplication rate) của ChatGPT rất cao, lên đến 71,03%, tức là nó thường xuyên trích dẫn lại những website quen thuộc.

Nguồn của ChatGPT rất đa dạng, bao gồm:

  • Nội dung do người dùng tạo ra: Reddit, Wikipedia, TikTok
  • Các tờ báo lớn: The Times, The Guardian
  • Nguồn chuyên môn: Investopedia, Microsoft

Ngoài ra, ChatGPT ưu tiên sử dụng các tên miền cũ có độ tuổi trên 15 năm chiếm 45,80%, nhưng đồng thời cũng tham khảo khá nhiều nguồn mới với tỷ lệ gần 12% (các website dưới 5 năm tuổi).

Google AI Overviews

Google AI Overviews cân bằng hơn nhưng vẫn rất tham chiếu, trung bình khoảng 9,26 liên kết mỗi câu trả lời. Tỷ lệ lặp lại tên miền thấp hơn ChatGPT, nhưng vẫn khá cao ở mức 58,49%.

Điểm đặc biệt là Google thường xuyên trích dẫn các mạng lưới chuyên nghiệp như LinkedIn, Indeed, và các nền tảng cộng đồng như Quora, Reddit. Google cũng dẫn đầu về tỷ lệ trích dẫn các tên miền cũ trên 15 năm với 49,21%.

Perplexity

Perplexity có cách tiếp cận trích dẫn rất có cấu trúc và nhất quán, thường xuyên sử dụng đúng 5 nguồn cho mỗi câu trả lời (1.980 trường hợp ghi nhận). Tỷ lệ lặp lại tên miền của Perplexity thấp hơn nhiều so với ChatGPT và Google, chỉ ở mức 25,11%.

Nguồn tham khảo của Perplexity thiên về nội dung giáo dục và liên quan đến AI, với các website như Moodle, GitHub, Jasper.ai, Studioglobal.ai. Perplexity chủ yếu tham khảo các trang web có tuổi đời từ 10-15 năm chiếm 26,16%.

Đáng chú ý, Perplexity có tỷ lệ chia sẻ tên miền cao nhất với ChatGPT (25,19%), cho thấy cách chọn nguồn có phần tương đồng.

Bing Copilot

Bing Copilot thì lại theo hướng tối giản nhất, với số lượng liên kết trung bình thấp nhất chỉ 3,13 liên kết mỗi câu trả lời và tỷ lệ lặp tên miền thấp nhất, chỉ 13,47%. Bing thường tập trung vào một số website thiết thực như WikiHow, Indeed, Healthline.

Khác với các công cụ AI còn lại, Bing tham khảo tỷ lệ tên miền mới cao nhất (18,85% các website dưới 5 năm tuổi), thể hiện sự mở cửa với các nguồn thông tin mới nổi. Ngoài ra, Bing cũng có tỷ lệ trùng lặp tên miền với các AI khác thấp nhất, cho thấy cách tiếp cận riêng biệt, độc lập hơn hẳn.

3. Phân tích nội dung trả lời: Độ dài, sự tương đồng, độ phức tạp, tính khách quan và hơn thế nữa

3.1. Độ dài câu trả lời của AI

Qua phân tích, chúng tôi nhận thấy sự khác biệt rõ ràng về độ dài trung bình của câu trả lời từ các công cụ tìm kiếm AI khác nhau:

  • Bing tạo ra các câu trả lời ngắn nhất, trung bình chỉ khoảng 398 ký tự (tương đương 83 từ) mỗi câu trả lời.
  • Perplexity xếp thứ hai với trung bình 1.310 ký tự (257 từ) cho mỗi câu trả lời.
  • AI Overviews của Google đứng thứ ba với 997 ký tự (191 từ) mỗi câu trả lời.
  • ChatGPT tạo ra câu trả lời dài nhất, trung bình 1.686 ký tự (318 từ), gấp khoảng 4 lần so với Bing.
Độ dài câu trả lời của AI
Độ dài câu trả lời của AI

Về số câu trung bình trong mỗi câu trả lời, ChatGPT và Perplexity có kết quả khá tương đồng, lần lượt là 22 và 21 câu. Google AI Overviews có trung bình 10 câu, trong khi Bing Copilot chỉ khoảng 7 câu mỗi câu trả lời.

ChatGPT và Perplexity có kết quả khá tương đồng, lần lượt là 22 và 21 câu
ChatGPT và Perplexity có kết quả khá tương đồng, lần lượt là 22 và 21 câu

Chúng tôi cũng xem xét số ký tự trung bình trên mỗi câu, được tính bằng cách lấy tổng ký tự chia cho tổng số câu. Kết quả như sau:

  • Bing Copilot: 60 ký tự/câu
  • Perplexity: 63 ký tự/câu
  • ChatGPT: 78 ký tự/câu
  • Google AIO: 101 ký tự/câu

Điều này cho thấy một xu hướng thú vị: các công cụ AI tạo ra câu trả lời dài thường lại sử dụng các câu ngắn hơn. Cụ thể, ChatGPT và Perplexity cho câu trả lời chi tiết hơn, dài hơn với trung bình lần lượt 1.686 và 1.310 ký tự. Hai công cụ này cũng chia nhỏ nội dung thành nhiều câu hơn (22 và 21 câu), giúp thông tin được trình bày theo cấu trúc rõ ràng với nhiều điểm nhỏ hoặc bước thực hiện, đồng thời các câu lại ngắn và dễ tiếp thu hơn.

Ngược lại, Google AI Overviews có độ dài ký tự khá cao (997 ký tự) nhưng số câu ít hơn (10 câu). Điều này có nghĩa mỗi câu dài hơn trung bình (101 ký tự), phản ánh xu hướng truyền tải thông tin dưới dạng câu dài, phức tạp hoặc lời giải thích chi tiết hơn trong mỗi câu.

Bing Copilot trả lời ngắn gọn (398 ký tự) với ít câu hơn (7 câu). Mỗi câu tương đối ngắn, khoảng 60 ký tự, phù hợp với kiểu trả lời nhanh, dễ lướt qua nhưng không cung cấp nhiều ngữ cảnh hay thông tin chi tiết.

Độ dài câu trả lời AI theo ngành nghề và công cụ

Chúng tôi phân tích thêm độ dài câu trả lời theo từng lĩnh vực chuyên môn để xem ngành nào có câu trả lời AI dài nhất:

  • Dịch vụ doanh nghiệp và tiêu dùng: 1.377 ký tự
  • Việc làm và sự nghiệp: 1.359 ký tự
  • Tài chính: 1.326 ký tự

Những ngành này thường có tính chất phức tạp hơn, dẫn đến việc AI phải tạo ra các câu trả lời đầy đủ và chi tiết hơn. Ví dụ, các chủ đề trong lĩnh vực Dịch vụ doanh nghiệp và Việc làm/Sự nghiệp thường yêu cầu mô tả chiến lược, hướng dẫn phát triển nghề nghiệp hoặc hỗ trợ ra quyết định. Các câu trả lời về Tài chính cũng cần giải thích chính xác, nhiều góc nhìn và chi tiết, nên câu trả lời thường dài hơn.

Ngược lại, các lĩnh vực có câu trả lời AI ngắn nhất gồm:

  • Game: 911 ký tự
  • Lifestyle (Phong cách sống): 1.051 ký tự
  • Sở thích và giải trí: 1.060 ký tự

Những ngành này thường đòi hỏi câu trả lời mang tính trực tiếp, ngắn gọn và dễ hiểu. Ví dụ, chủ đề về Game thường là mẹo chơi nhanh, mã gian lận hoặc cách vận hành game, không cần giải thích quá sâu. Lifestyle và Sở thích/Giải trí cũng thường có nội dung nhẹ nhàng, khuyên dùng ngắn gọn hoặc các lời khuyên đơn giản.

Những ngành có tính chất phức tạp, dẫn đến việc AI phải tạo ra các câu trả lời đầy đủ
Những ngành có tính chất phức tạp, dẫn đến việc AI phải tạo ra các câu trả lời đầy đủ

Kết quả phân tích độ dài câu trả lời của AI theo từng ngành nghề

Khi phân tích độ dài câu trả lời của AI trong từng lĩnh vực, chúng tôi nhận thấy:

  • ChatGPT luôn cho ra những câu trả lời dài nhất ở hầu hết các ngành nghề.
  • Bing Copilot liên tục cung cấp các câu trả lời ngắn nhất.
  • Google AIOs và Perplexity thường nằm ở mức trung bình, trong đó Perplexity có xu hướng tạo ra câu trả lời hơi dài hơn Google một chút.

Ở ngành Game, tất cả các công cụ AI đều đưa ra câu trả lời ngắn nhất:

  • Bing Copilot: 336 ký tự
  • Google AIOs: 598 ký tự
  • Perplexity: 1.117 ký tự
  • ChatGPT: 1.305 ký tự

Đặc biệt, trong ngành Tài chính (Finance), ChatGPT tạo ra câu trả lời dài hơn hẳn so với các công cụ khác, với trung bình lên tới 2.060 ký tự, cao hơn nhiều so với mức trung bình chung của nó (1.686 ký tự).

Ngược lại, Google AI Overviews có kết quả tương tự với lĩnh vực Dịch vụ doanh nghiệp và tiêu dùng (Business and Consumer Services), đạt 1.372 ký tự, dài hơn khoảng 35% so với mức trung bình thường thấy (997 ký tự).

Ở ngành Dịch vụ doanh nghiệp và tiêu dùng, Perplexity cho ra câu trả lời dài nhất với 1.485 ký tự, trong khi Bing Copilot dẫn đầu về độ dài câu trả lời trong ngành Nghệ thuật và Giải trí (Arts and Entertainment), với 482 ký tự mỗi câu trả lời.

Perplexity cho ra câu trả lời dài nhất với 1.485 ký tự
Perplexity cho ra câu trả lời dài nhất với 1.485 ký tự

3.2. Độ tương đồng ngữ nghĩa trong câu trả lời của AI

Chúng tôi đã sử dụng phương pháp hai bước để đánh giá mức độ tương đồng ngữ nghĩa giữa các câu trả lời do các công cụ tìm kiếm AI khác nhau tạo ra.

Bước 1: Dùng thư viện sentence-transformers để chuyển đoạn văn bản câu trả lời thành các vector embeddings (đại diện số học cho ý nghĩa câu).
Bước 2: Áp dụng hàm cosine similarity từ thư viện sklearn để tính toán độ tương đồng dựa trên góc cosine giữa các cặp embeddings này.

Điểm cosine similarity càng cao (thang điểm từ 0 đến 1) thì mức độ tương đồng ngữ nghĩa giữa hai câu trả lời càng lớn.

Kết quả so sánh mức độ tương đồng ngữ nghĩa giữa các cặp công cụ:

  • Perplexity / ChatGPT: 0.82
  • Perplexity / Bing Copilot: 0.57
  • Bing Copilot / ChatGPT: 0.56
  • Perplexity / Google AIO: 0.48
  • Google AIO / ChatGPT: 0.48
  • Bing Copilot / Google AIO: 0.48
Độ tương đồng ngữ nghĩa trong câu trả lời của AI
Độ tương đồng ngữ nghĩa trong câu trả lời của AI

Giải thích kết quả:

  • Perplexity và ChatGPT có mức độ tương đồng ngữ nghĩa cao nhất (0.82). Điều này cho thấy nội dung câu trả lời của hai công cụ này rất gần nhau. Có thể cả hai đều sử dụng kỹ thuật AI sinh nội dung tương tự trong cách hiểu truy vấn hoặc phương pháp huấn luyện.
  • Google AI Overviews thể hiện mức độ tương đồng thấp hơn đáng kể với các công cụ khác (0.48). Điều này cho thấy Google có cách tiếp cận riêng biệt trong việc tạo câu trả lời. Google tạo ra câu trả lời ở mức độ dài trung bình, khác biệt rõ rệt so với các giải thích chi tiết, mở rộng thường thấy ở Perplexity và ChatGPT.
  • Bing Copilot có mức độ tương đồng trung bình với Perplexity và ChatGPT. Mặc dù Bing có xu hướng tạo ra câu trả lời ngắn hơn, nhưng vẫn chia sẻ một số đặc điểm ngữ nghĩa với hai công cụ kia. Tuy nhiên, độ sâu thông tin trong câu trả lời của Bing thường hạn chế hơn.

Độ tương đồng ngữ nghĩa của câu trả lời AI theo ngành nghề

Dưới đây là các ngành mà mỗi công cụ cho câu trả lời có mức tương đồng ngữ nghĩa cao nhất:

  • Sức khỏe (Health): 0.66
  • Việc làm và sự nghiệp (Jobs and Career): 0.65
  • Luật pháp và Chính phủ (Law and Government) & Phong cách sống (Lifestyle): 0.64
  • Cộng đồng và Xã hội (Community and Society) & Thú cưng và động vật (Pets and Animals): 0.63
  • Dịch vụ doanh nghiệp và tiêu dùng (Business and Consumer Services): 0.62

Ngược lại, các ngành có mức tương đồng thấp nhất gồm:

  • Máy tính, Điện tử và Công nghệ (Computers, Electronics and Technology): 0.52
  • Tài chính (Finance): 0.51
  • Thể thao (Sports): 0.50
  • Du lịch và Lữ hành (Travel and Tourism): 0.49
  • Ẩm thực và Đồ uống (Food and Drink): 0.40
Độ tương đồng ngữ nghĩa của câu trả lời AI theo ngành nghề
Độ tương đồng ngữ nghĩa của câu trả lời AI theo ngành nghề

Điều đặc biệt là mức độ tương đồng ngữ nghĩa giữa ChatGPT và Perplexity luôn duy trì ở mức cao (từ 0.80 đến 0.84) trên tất cả các ngành nghề, kể cả những lĩnh vực mà các cặp công cụ AI khác cho kết quả khá khác biệt.

Điểm tương đồng ngữ nghĩa giữa hai công cụ này đạt mức cao nhất (0.84) trong các ngành:

  • Sức khỏe (Health)
  • Sở thích và giải trí (Hobbies and Leisure)
  • Nhà cửa và vườn tược (Home and Garden)
  • Phong cách sống (Lifestyle)

Điều này có thể lý giải bởi các chủ đề này thường mang tính chủ quan cao hơn. Perplexity và ChatGPT trong những lĩnh vực này gần như có thể thay thế lẫn nhau vì độ giống nhau trong cách trả lời.

Điểm tương đồng ngữ nghĩa giữa các công cụ
Điểm tương đồng ngữ nghĩa giữa các công cụ

3.3. Độ đa dạng từ vựng trong câu trả lời của AI

Độ đa dạng từ vựng (lexical diversity) đo lường mức độ biến hóa trong từ ngữ sử dụng của một đoạn văn bản. Điểm số càng cao nghĩa là từ vựng càng phong phú, ngược lại điểm thấp cho thấy nhiều từ bị lặp lại.

Trong phân tích của chúng tôi, tỷ lệ tính dựa trên số từ độc nhất chia cho tổng số từ trong câu trả lời, và được tổng hợp theo từng công cụ để lấy điểm trung bình. Các từ dừng (stop words) như “to,” “and,” “a,” “it,” “is”… được loại bỏ dựa trên danh sách NLTK Stopword List để tập trung vào từ có ý nghĩa.

Kết quả điểm lexical diversity theo công cụ:

  • Bing Copilot: 0.54
  • ChatGPT: 0.51
  • Google AIOs: 0.49
  • Perplexity: 0.46
Độ đa dạng từ vựng trong câu trả lời của AI
Độ đa dạng từ vựng trong câu trả lời của AI

Chúng tôi khá bất ngờ khi Bing Copilot lại có điểm đa dạng từ vựng cao nhất. Mặc dù Bing thường trả lời ngắn hơn, nhưng lại sử dụng từ vựng đa dạng nhất. Điều này có thể giải thích do câu trả lời ngắn thường ít lặp từ hơn, mỗi câu truyền tải thông tin riêng biệt, từ đó dẫn đến sự đa dạng ngôn ngữ cao hơn.

ChatGPT cung cấp câu trả lời dài, chi tiết với mức độ đa dạng từ vựng cũng khá cao. Google AIOs có điểm thấp hơn một chút, thể hiện xu hướng sử dụng từ khóa lặp hoặc câu cú chuẩn hóa hơn. Perplexity có điểm thấp nhất về đa dạng từ vựng.

Độ đa dạng từ vựng theo ngành nghề và công cụ

Ngành nghề có điểm lexical diversity trung bình cao nhất gồm:

  • Việc làm và sự nghiệp (Jobs and Career): 0.54
  • Dịch vụ doanh nghiệp và tiêu dùng (Business and Consumer Services): 0.53
  • Sức khỏe, Khoa học và Giáo dục (Health & Science and Education): 0.52

Những ngành này thường đề cập đến các chủ đề phức tạp, đòi hỏi lời giải thích chi tiết, sử dụng nhiều thuật ngữ chuyên ngành và từ vựng rộng. Dữ liệu cũng cho thấy các ngành này có câu trả lời dài hơn, ví dụ: Dịch vụ doanh nghiệp và tiêu dùng có câu trả lời trung bình 1,377 ký tự; Việc làm và sự nghiệp khoảng 1,359 ký tự.

Ngành nghề có điểm đa dạng từ vựng thấp nhất bao gồm:

  • Công nghiệp nặng và kỹ thuật, Sở thích và giải trí, Luật pháp và Chính phủ, Phong cách sống: 0.48
  • Máy tính, Điện tử và Công nghệ & Trò chơi (Games): 0.47
  • Phương tiện giao thông (Vehicles): 0.46

Mức độ đa dạng từ vựng thấp này có thể liên quan đến độ dài câu trả lời ngắn hơn hoặc sự lặp lại nhiều trong ngôn ngữ sử dụng, do nội dung đơn giản hơn hoặc tính chuyên môn hóa cao. Ví dụ, các ngành như Phương tiện giao thông hay Máy tính, Điện tử thường xuyên nhắc đến các thông số kỹ thuật, mẫu mã hay tính năng cố định. Ngành Trò chơi hoặc Ẩm thực & Đồ uống có thể sử dụng nhiều cụm từ mô tả hoặc hướng dẫn phổ biến.

Mức độ đa dạng từ vựng thấp này có thể liên quan đến độ dài câu trả lời ngắn hơn
Mức độ đa dạng từ vựng thấp này có thể liên quan đến độ dài câu trả lời ngắn hơn

So sánh lexical diversity giữa các công cụ theo từng ngành

Bing Copilot và Perplexity thể hiện sự đối lập rõ nét. Bing Copilot luôn giữ vị trí dẫn đầu về đa dạng từ vựng trên tất cả ngành nghề, trong khi Perplexity thường đứng cuối bảng.

Các ngành có câu trả lời dài nhất cũng thường có điểm lexical diversity cao nhất ở mọi công cụ. Chẳng hạn, trong ngành Việc làm và sự nghiệp, điểm đa dạng từ vựng của Bing là 0.59, Google AIOs 0.54, Perplexity 0.49 và ChatGPT 0.54 — đều cao hơn mức trung bình chung của từng công cụ (Bing 0.54, Google AIOs 0.49, Perplexity 0.46, ChatGPT 0.51).

Điều này cho thấy độ phức tạp của chủ đề ảnh hưởng đến độ dài câu trả lời cũng như sự phong phú về ngôn ngữ trong nội dung.

So sánh lexical diversity giữa các công cụ theo từng ngành
So sánh lexical diversity giữa các công cụ theo từng ngành

Các cụm từ đặc trưng trong câu trả lời của AI

Chúng tôi cũng đã kiểm tra các câu trả lời để tìm những từ và cụm từ thường xuất hiện trong văn bản do AI tạo ra. Dựa trên danh sách riêng gồm 137 từ và cụm từ phổ biến trong văn bản AI (gọi là “AI marker phrases”), ví dụ như: in today’s digital landscape (trong bối cảnh số hóa hiện nay), harnessing the power of (tận dụng sức mạnh của), a game-changer in the field (bước ngoặt trong lĩnh vực), navigate the complexities (điều hướng những phức tạp), v.v.

Trong tổng số 6,612 câu trả lời được phân tích:

  • 79.19% (5,236 câu) có ít nhất một cụm từ đặc trưng AI
  • 61.52% (4,068 câu) có hai cụm từ trở lên

Phân tích theo từng công cụ cho thấy:

  • ChatGPT có tỷ lệ xuất hiện cụm từ AI cao nhất. Trong 1,998 câu trả lời, có 1,854 câu (92.79%) chứa ít nhất một cụm từ, và 1,693 câu (84.73%) có hai cụm từ trở lên.
  • Perplexity cũng dùng nhiều cụm từ AI, với 1,811 câu (90.6%) có ít nhất một cụm và 1,545 câu (77.29%) có hai cụm trở lên trong tổng 1,999 câu trả lời.
  • Google AIOs có mức độ trung bình, 926 câu (79.62%) có một cụm, 599 câu (51.5%) có hai cụm trở lên trên 1,163 câu trả lời.
  • Bing Copilot có tần suất thấp nhất, chỉ 645 câu (44.42%) có ít nhất một cụm, và 231 câu (15.91%) có hai cụm trở lên trong 1,452 câu trả lời.
Các cụm từ đặc trưng trong câu trả lời của AI
Các cụm từ đặc trưng trong câu trả lời của AI

Chúng tôi cũng nhận thấy các công cụ có tỷ lệ cụm từ AI cao nhất (ChatGPT và Perplexity) cũng có điểm tương đồng ngữ nghĩa (semantic similarity) cao nhất (0.82). Điều này cho thấy hiện tượng “đồng thuận ngôn ngữ” (linguistic convergence) – tức các mô hình AI tiên tiến có cách diễn đạt rất giống nhau.

Những đặc điểm khác biệt giữa các công cụ AI

Dữ liệu về độ đa dạng từ vựng (lexical diversity), tương đồng ngữ nghĩa (semantic similarity), và tần suất cụm từ AI cho thấy các công cụ sử dụng cách tiếp cận khác nhau:

  • Bing có độ đa dạng từ vựng cao nhất (0.54), tần suất dùng cụm từ AI thấp nhất (44.42%), và câu trả lời ngắn nhất (trung bình 383 ký tự). Đây là chiến lược tập trung tối đa vào mật độ thông tin – nói ít nhưng đủ, rõ ràng.
  • ChatGPT có độ đa dạng từ vựng vừa phải (0.51), nhưng sử dụng quá nhiều cụm từ AI (92.79%) và câu trả lời dài nhất (trung bình 1,686 ký tự). Cách làm này thiên về thuyết phục bằng lượng thông tin lớn kèm sự tự tin trong cách diễn đạt.

Chúng ta thấy rõ hai trường phái khác biệt: Bing theo hướng tối giản, súc tích và ChatGPT theo hướng tối đa, chi tiết và uy quyền.

3.4. Mức độ khách quan trong câu trả lời của AI

Chúng tôi dùng thư viện TextBlob (Python) để tính điểm chủ quan (subjectivity score) trong câu trả lời AI, tức mức độ xuất hiện của ngôn ngữ mang quan điểm cá nhân. Điểm 1 là cực kỳ chủ quan, điểm 0 nghĩa là hoàn toàn khách quan, trung lập.

Mức khách quan trung bình của các công cụ dao động trong khoảng 0.44 – 0.50, phân bố như sau:

  • Perplexity (điểm chủ quan cao nhất 0.50): Thường có quan điểm hoặc diễn giải riêng.
    Google AIOs (chủ quan vừa phải 0.48): Kết hợp thông tin thực tế với lời lôi kéo hoặc đánh giá.
  • Bing Copilot (0.45): Thỉnh thoảng dùng cách diễn đạt bị ảnh hưởng bởi quan điểm cá nhân.
  • ChatGPT (0.44): Phong cách khách quan hơn, thiên về sự kiện, dữ liệu.
Mức độ khách quan trong câu trả lời của AI
Mức độ khách quan trong câu trả lời của AI

Khách quan theo ngành nghề và công cụ

Ba ngành nghề có câu trả lời AI khách quan nhất là:

  • Luật pháp và Chính phủ: 0.41
  • Tài chính: 0.43
  • Du lịch và Lữ hành: 0.44

Các ngành này thuộc nhóm YMYL (Your Money or Your Life) – nơi độ chính xác và tránh thiên lệch cực kỳ quan trọng. Nội dung thiên về thông tin, sự kiện hoặc quy trình, ít chỗ cho suy diễn cá nhân.

Ngành có câu trả lời AI chủ quan nhiều nhất gồm:

  • Sở thích và giải trí: 0.49
  • Công nghiệp nặng và kỹ thuật: 0.50
  • Ẩm thực và Đồ uống: 0.51

Ngành này thường có lời khuyên hoặc đánh giá, dễ mang sắc thái chủ quan. Ví dụ, ngành Ẩm thực thường mô tả vị giác, còn Sở thích và giải trí có thể gợi ý theo sở thích cá nhân.

Khách quan theo ngành nghề và công cụ
Khách quan theo ngành nghề và công cụ

Khách quan theo từng công cụ và ngành nghề

  • Bing Copilot khách quan nhất ở Luật pháp và Chính phủ (0.39), nhưng chủ quan nhất ở Trò chơi (0.49).
  • Google AIOs khách quan nhất ở Luật pháp và Chính phủ (0.41), chủ quan nhất ở Ẩm thực & Đồ uống và Phong cách sống (0.52).
  • Perplexity khách quan thấp nhất ở nhiều ngành, kể cả Luật pháp và Chính phủ (0.43), đồng thời chủ quan nhất ở Ẩm thực, Công nghiệp nặng, Nhà cửa & Vườn, Sở thích & Giải trí (0.53).
  • ChatGPT khách quan nhất ở Luật pháp và Chính phủ (0.39), nhưng chủ quan nhiều nhất ở Ẩm thực và Sở thích & Giải trí (0.49).
Khách quan theo từng công cụ và ngành nghề
Khách quan theo từng công cụ và ngành nghề

Độ dễ đọc của câu trả lời AI

Để đánh giá độ dễ đọc của các câu trả lời do AI tạo ra, chúng tôi sử dụng chỉ số Coleman-Liau, một phương pháp dựa trên việc đếm số chữ cái và từ trong đoạn văn. Chỉ số này ít bị ảnh hưởng bởi cấu trúc câu hay các lỗi định dạng, đồng thời tính toán mức học vấn (theo hệ thống giáo dục Mỹ) cần có để hiểu được nội dung đó.

Thang điểm Coleman-Liau về độ dễ đọc:

  • Giá trị từ 0-1 tương ứng với độc giả từ 3-7 tuổi (mức cơ bản)
  • Giá trị từ 1-5 tương ứng với độc giả từ 7-11 tuổi (dễ đọc)
  • Giá trị từ 5-8 tương ứng với độc giả từ 11-14 tuổi (phù hợp độc giả trung bình)
  • Giá trị từ 8-11 tương ứng với độc giả từ 14-17 tuổi (khá khó đọc)
  • Giá trị trên 11 tương ứng với độc giả trên 17 tuổi (quá khó để đọc)

Kết quả phân tích cho thấy:
Bing đạt điểm cao nhất với 9.94, cho thấy câu trả lời của công cụ này hướng tới đối tượng độc giả rộng rãi hơn. Perplexity giữ vị trí tốt với điểm 11.48, trong khi ChatGPT và Google AIOs có độ phức tạp cao hơn với điểm lần lượt là 12.85 và 12.75.

Bing đạt điểm cao nhất với 9.94
Bing đạt điểm cao nhất với 9.94

Xét theo từng lĩnh vực chuyên môn (niche), những ngành có độ khó hiểu cao nhất, nơi câu trả lời AI là khó nắm bắt nhất, bao gồm:

  • Việc làm và sự nghiệp (Jobs and Career): 15.44
  • Tài chính (Finance): 14.47
  • Kinh doanh và dịch vụ tiêu dùng (Business and Consumer Services): 14.02

Những lĩnh vực này thường yêu cầu kiến thức chuyên môn cao do sử dụng nhiều thuật ngữ đặc thù, khái niệm phức tạp và ngôn ngữ chuyên sâu.

Ngược lại, các lĩnh vực có độ dễ đọc cao nhất (câu trả lời AI dễ hiểu nhất) gồm:

  • Lối sống (Lifestyle): 9.98
  • Sở thích và giải trí (Hobbies and Leisure): 9.55
  • Ẩm thực và đồ uống (Food and Drink): 9.27

Các câu trả lời trong những lĩnh vực này thường đơn giản hơn, dễ tiếp cận và được tối ưu cho nhóm độc giả phổ thông, không đòi hỏi kiến thức chuyên môn cao.

Các câu trả lời trong những lĩnh vực này thường đơn giản hơn, dễ tiếp cận và được tối ưu cho nhóm độc giả phổ thông
Các câu trả lời trong những lĩnh vực này thường đơn giản hơn, dễ tiếp cận và được tối ưu cho nhóm độc giả phổ thông

3.5. Độ phức tạp ngữ pháp trong câu trả lời AI

Chúng tôi sử dụng thư viện spaCy để phân tích độ phức tạp ngữ pháp trong các câu trả lời do AI tạo ra. Phương pháp này giúp đo lường tỷ lệ câu phức tạp, tức là những câu chứa nhiều mệnh đề hoặc cấu trúc phụ, trong tổng số câu trả lời của mỗi công cụ.

Kết quả cho thấy sự khác biệt rõ ràng giữa các công cụ:

  • Bing Copilot có điểm phức tạp ngữ pháp thấp nhất (0.38), sử dụng câu văn đơn giản, phù hợp với phong cách trả lời ngắn gọn, súc tích.
  • Google AIOs có độ phức tạp vừa phải (0.40), giúp các câu trả lời dễ tiếp cận và dễ hiểu.
  • ChatGPT và Perplexity có độ phức tạp ngữ pháp cao nhất, cùng đạt điểm 0.59, thường dùng cấu trúc câu phức tạp hơn, phản ánh qua những câu trả lời dài và chi tiết hơn.
Độ phức tạp ngữ pháp trong câu trả lời AI
Độ phức tạp ngữ pháp trong câu trả lời AI

Các lĩnh vực có độ phức tạp ngữ pháp cao nhất bao gồm:

  • Việc làm và sự nghiệp (Jobs and Career): 0.61
  • Cộng đồng và xã hội (Community and Society): 0.58
  • Sức khỏe (Health): 0.57

Điều này hợp lý vì những lĩnh vực này thường đề cập đến các chủ đề phức tạp, sử dụng ngôn ngữ chuyên ngành. Chúng thường có câu chứa nhiều mệnh đề hoặc cấu trúc phụ để truyền tải những khái niệm chi tiết.

Các lĩnh vực có độ phức tạp ngữ pháp thấp nhất bao gồm:

  • Ẩm thực và đồ uống (Food and Drink): 0.36
  • Trò chơi (Games): 0.40
  • Du lịch và lữ hành (Travel and Tourism): 0.42

Các câu trả lời trong những lĩnh vực này thường ngắn gọn, đơn giản và dễ hiểu.

Các lĩnh vực có độ phức tạp ngữ pháp thấp nhất
Các lĩnh vực có độ phức tạp ngữ pháp thấp nhất

3.6. Giọng điệu cảm xúc trong câu trả lời của AI

Chúng tôi đánh giá giọng điệu cảm xúc trong các câu trả lời AI bằng cách sử dụng thư viện Transformers cùng mô hình Emotion English DistilRoBERTa-base đã được huấn luyện sẵn để phân loại cảm xúc. Kết quả cho thấy tất cả các công cụ đều có mức độ trung tính rất cao trong câu trả lời của mình, điều này hoàn toàn hợp lý và được kỳ vọng đối với các công cụ tìm kiếm.

  • Perplexity có mức độ trung tính cao nhất (96.39%)
  • Bing có mức trung tính thấp nhất (91.94%)
  • ChatGPT gần mức trung tính của Perplexity (95.10%)
  • Google AIOs gần với Bing Copilot hơn (92.42%)
Giọng điệu cảm xúc trong câu trả lời của AI
Giọng điệu cảm xúc trong câu trả lời của AI

Tuy nhiên, các công cụ tìm kiếm AI cũng thể hiện cảm xúc khác ngoài trung tính. Với Perplexity và ChatGPT, cảm xúc phổ biến thứ ba là vui vẻ (joy). Ngoài ra, cả bốn công cụ đều có sự xuất hiện nhẹ của các giọng điệu tiêu cực như ghê tởm (disgust) hoặc sợ hãi (fear), đặc biệt là Bing Copilot và Google AI Overviews có cả hai cảm xúc này. Điều này có thể giải thích do các công cụ thận trọng sử dụng ngôn ngữ cảnh báo khi trả lời những nội dung nhạy cảm hoặc liên quan đến rủi ro như sức khỏe thể chất và tinh thần.

Phân tích sâu hơn các câu trả lời thể hiện cảm xúc vui vẻ cho thấy chúng thường sử dụng ngôn ngữ tích cực. Những từ như enjoy (thưởng thức), happy (vui), love (yêu thích), wonderful (tuyệt vời), good (tốt) xuất hiện rất đều đặn. Hơn một nửa các câu trả lời trong nhóm cảm xúc vui vẻ chứa từ enjoy, thường kèm theo lời khuyên để người dùng tìm thấy niềm vui trong các hành động cụ thể.

Perplexity và ChatGPT thường dùng giọng điệu khích lệ, tích cực trong giao tiếp. Các mô hình này trả lời với phong cách thân thiện, lạc quan, thường kèm dấu chấm than hoặc bình luận tích cực (ví dụ: That’s a great idea! hoặc That could be a fun project!). Họ không chỉ cung cấp thông tin mà còn hướng dẫn từng bước, làm cho câu trả lời trở nên hỗ trợ và đầy hy vọng.

Theo từng lĩnh vực, mức độ trung tính và cảm xúc được ghi nhận như sau:

  • Lĩnh vực Tài chính (Finance) có mức trung tính cao nhất (99.67%), nơi mà sự chính xác và khách quan là tối quan trọng.
  • Lĩnh vực Cộng đồng và xã hội (Community and Society) có mức trung tính thấp nhất (73.84%) và mức cảm xúc vui vẻ cao nhất (11.92%), phản ánh tính chất cảm xúc của các chủ đề xã hội.
Mức độ trung tính và cảm xúc được ghi nhận
Mức độ trung tính và cảm xúc được ghi nhận

Perplexity và ChatGPT: Cặp đôi “giống nhau đến ngỡ ngàng”

Trong các công cụ AI được phân tích, Perplexity và ChatGPT thể hiện mức độ tương đồng về mặt ngữ nghĩa cao nhất (0.82). Ở nhiều lĩnh vực như Sức khỏe (Health) hoặc Giải trí – sở thích cá nhân (Hobbies and Leisure), mức tương đồng còn lên tới 0.84 – gần như cho ra nội dung giống nhau. Cả hai công cụ cũng chia sẻ phong cách giao tiếp tương tự: cấu trúc ngữ pháp phức tạp ngang nhau (0.59), câu trả lời dài, mang tính khích lệ và thường xuyên thể hiện cảm xúc tích cực như “joy” (niềm vui) – chỉ đứng sau giọng điệu trung tính.

Bing Copilot: Đi theo hướng tối giản và dễ đọc

Bing Copilot có cách tiếp cận hoàn toàn khác biệt với chiến lược “mật độ thông tin tối đa” – tức là đưa nhiều thông tin nhất trong một câu trả lời ngắn gọn, dễ hiểu. Công cụ này đạt chỉ số dễ đọc cao (Coleman-Liau index = 9.94) và ngữ pháp đơn giản nhất trong tất cả (điểm độ phức tạp ngữ pháp = 0.38).

Mặc dù vẫn có điểm tương đồng với ChatGPT về mặt nội dung, nhưng cách trình bày của Bing rõ ràng thiên về phong cách rút gọn, phục vụ nhóm người dùng phổ thông thay vì chuyên gia.

Google AI Overviews: Phức tạp và “hàn lâm” nhất

Google AI Overviews lại đi theo hướng ngược lại, khi là công cụ có mức độ tương đồng ngữ nghĩa thấp nhất với các công cụ còn lại (0.48). Câu trả lời của Google có độ dài trung bình (khoảng 997 ký tự), nhưng lại khó đọc nhất (Coleman-Liau index = 12.75), cho thấy nó nhắm đến đối tượng người dùng có trình độ cao hơn.

Mức độ phức tạp ngữ pháp của Google ở mức trung bình (0.40) – tương tự Bing. Tuy nhiên, Google có tỷ lệ tương quan cao nhất giữa độ dài câu trả lời và số lượng liên kết trích dẫn (0.38), phản ánh định hướng luôn cố gắng hỗ trợ quan điểm bằng nguồn đáng tin cậy.

Tổng kết: Chủ đề quyết định phong cách câu trả lời

Phân tích này cho thấy một yếu tố quan trọng ảnh hưởng đến cách AI trả lời – đó chính là chủ đề truy vấn:

  • Chủ đề chuyên môn cao như Tài chính (Finance) hay Nghề nghiệp (Career): câu trả lời có xu hướng phức tạp hơn, khách quan hơn, phản ánh yêu cầu về tính chính xác và tiêu chuẩn ngành.
  • Chủ đề đời sống thường ngày như Ẩm thực (Food) hay Giải trí (Hobbies): nội dung đơn giản, dễ hiểu và mang tính cá nhân hơn, vì sở thích cá nhân đóng vai trò quan trọng.
  • Chủ đề xã hội: thể hiện rõ ràng nhất sự đa dạng về cảm xúc và giọng điệu – cho thấy bản chất phức tạp của các vấn đề xã hội.

Phương pháp nghiên cứu (Brief methodology)

Để thực hiện phân tích này, nhóm nghiên cứu đã lựa chọn 2.000 từ khóa dạng “how-to” (hướng dẫn) trải đều trên 20 lĩnh vực khác nhau, tương ứng 100 từ khóa cho mỗi lĩnh vực.

  • Thời gian khảo sát: Từ ngày 26/02/2025 đến 03/03/2025
  • Khu vực tìm kiếm: Hoa Kỳ (USA)
  • Ngôn ngữ: Tiếng Anh (English – en)

Các công cụ AI tìm kiếm được so sánh:

  • ChatGPT (SearchGPT)
  • Google AI Overviews
  • Bing Copilot
  • Perplexity (Search mode)

Công cụ SEO hỗ trợ phân tích (sử dụng SE Ranking):

  • Competitor Analysis Tool – Công cụ phân tích đối thủ
  • Backlink Checker – Công cụ kiểm tra backlink
  • AI Overview Tracker – Theo dõi dữ liệu hiển thị từ AI

Thư viện & công cụ lập trình bổ trợ:

  • sentence_transformers + Cosine Similarity (từ thư viện sklearn) – Đo mức độ tương đồng ngữ nghĩa
  • yake – Tự động trích xuất từ khóa
  • Stanza – Phân tích ngôn ngữ tự nhiên
  • Coleman-Liau Index – Đo mức độ dễ đọc
  • spaCy – Phân tích cấu trúc ngữ pháp
  • Transformers + Emotion English DistilRoBERTa-base – Phân tích cảm xúc
  • TextBlob – Phân tích sắc thái văn bản

Các công cụ tìm kiếm AI hiện nay đang sử dụng những cách tiếp cận rất khác nhau trong việc: trình bày nội dung, lựa chọn nguồn tham khảo và cách hỗ trợ thông tin cho người dùng. Dữ liệu từ nghiên cứu này cho thấy: không còn một công thức SEO duy nhất cho mọi nền tảng. Mỗi công cụ AI từ ChatGPT đến Google AI Overviews đều có cách “đọc” và “ưu tiên” nội dung khác nhau. Muốn xuất hiện nổi bật, bạn cần một chiến lược nội dung được tùy biến theo từng công cụ AI, chứ không chỉ tối ưu hóa theo từ khóa truyền thống.

Trong bối cảnh AI đang dần thay đổi cách người dùng tiếp cận thông tin, việc hiểu rõ “hành vi” của từng công cụ tìm kiếm AI không chỉ là lợi thế, mà sẽ là yếu tố sống còn trong chiến lược SEO hiện đại.

SEONGON – Google Marketing Agency chuyên nghiệp tại Việt Nam, với kinh nghiệm thực chiến trên hàng trăm dự án SEO, luôn đón đầu xu hướng AI Search. Chúng tôi giúp thương hiệu của bạn:

  • Phân tích và tối ưu nội dung theo “tính cách” của từng công cụ AI
  • Tăng khả năng xuất hiện trong AI Answers và Google AI Overviews
  • Xây dựng chiến lược SEO toàn diện: từ kỹ thuật, nội dung, đến xây dựng thương hiệu tìm kiếm

Thực hiện bởi: SEONGON – Google Marketing Agency

Tác giả

Với tôi, SEO không chỉ là 1 nghề mà SEO là một niềm đam mê. Đam mê nghiên cứu hành trình khách hàng, đam mê phân tích chuyển đổi dựa trên số liệu, đam mê Digital Marketing tổng thể.v.v.v. Và hơn hết, đam mê chia sẻ kiến thức đó tới tất cả mọi người.

Bình luận

0 0 đánh giá
Đánh giá bài viết
Theo dõi
Thông báo của
guest
0 Các bình luận khác
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận

Bạn có thể liên hệ với chúng tôi, với kinh nghiệm triển khai thành công hàng nghìn chiến dịch quảng cáo chuyển đổi,
SEONGON tự tin có thể giúp bạn tối ưu hiệu quả và tiết kiệm chi phí tối đa với hoạt động quảng cáo.

BÀI VIẾT LIÊN QUAN