Trong bối cảnh khi các công cụ AI như ChatGPT, Bard hay Bing AI đang ngày càng làm giảm lượng tìm kiếm trên các công cụ tìm kiếm như của Google, gã khổng lồ tìm kiếm cũng có nhiều thay đổi trong cách tiếp cận, giảm nhân sự mảng hướng dẫn tìm kiếm (Search guidelines) hay có cách tiếp cận mới trong thuật toán nội dung hữu ích của Google là hai trong số đó.

Thuật toán nội dung hữu ích (Google Helpful Content Algorithm) là gì?

Được ra mắt lần đầu năm 2022, thuật toán nội dung hữu ích của Google (Google Helpful Content) hay Hệ thống nội dung hữu ích của Google được thiết kế để “thưởng” cho các website có chất lượng nội dung tốt, những nội dung được tạo cho người dùng thay vì cho các công cụ tìm kiếm.

Tuy nhiên, thuật toán này vẫn đối diện với nhiều chỉ trích từ phía chủ sở hữu website, cho rằng Google không thể tìm thấy cái gọi là “hữu ích” từ các nội dung trực tuyến.

“Đây là một trò đùa, các nội dung được nghiên cứu kỹ lưỡng, viết tốt, chứa đầy nội dung và hình ảnh gốc nhưng lại không hề được ưu tiên, Google rõ ràng đang buộc các nhà xuất bản phải tạo ra các nội dung rác từ AI (trí tuệ nhân tạo).”

Chủ các website phàn nàn rằng bản cập nhật thuật toán “nội dung hữu ích” mới đây của Google mặc dù được cho là nhằm cải thiện chất lượng kết quả tìm kiếm, tuy nhiên, sự thật là nó đã và đang diễn ra theo một cách khác.

Trong bản cập nhật thuật toán Google Helpful Content tháng 9 mới đây, Google cho biết hệ thống tìm kiếm của Google sẽ không chỉ tiếp tục ưu tiên cho các nội dung hữu ích, được tạo ra cho con người đọc mà còn nới lỏng các hạn chế với những nội dung do các công cụ AI tạo ra.

Mặc dù cái gọi là “hữu ích” vẫn chưa thực sự thể hiện rõ qua cách Google xếp hạng các nội dung trên trang kết quả tìm kiếm (SERPs), quan điểm mới của Google với các nội dung do AI (trí tuệ nhân tạo) tạo ra cũng dấy lên nhiều lo ngại về quyền tác giả, tính xác thực hay cả chất lượng của nội dung.

Cũng theo chính Google, “nội dung hữu ích” thay vì như trước đây là những nội dung “do con người tạo ra và hữu ích cho mọi người” thì giờ đây nó sẽ là “nội dung hữu ích là những nội dung được viết cho mọi người”.

Cũng theo thông báo này, công cụ tìm kiếm sẽ vẫn thúc đẩy các nội dung (content) do AI tạo ra trong trang kết quả tìm kiếm miễn là nó được coi là “có chất lượng cao”.

Với những gì đang diễn ra, nhiều chủ sở hữu website cho biết các nội dung do AI tạo ra đang có kết quả xếp hạng cao hơn các nội dung do con người viết, trong khi những người khác cho biết các nội dung đang có xếp hạng cao lại không thực sự “hữu ích”.

Hàng hoạt các website và thông tin trên các diễn đàn SEO cũng cho biết nội dung do AI tạo ra cũng đã bắt đầu xuất hiện phía trên các nội dung của họ (vốn do người viết).

Trong khi Google thường xuyên cập nhật cho các thuật toán của mình, và các nhà sáng tạo nội dung hay chủ các website vẫn phải “đau đầu” với nó, một số chủ sở hữu trang web khẳng định họ chưa bao giờ thấy sự thay đổi như thế này trước đây.

Nội dung do AI tạo ra và nhiều mối nguy tiềm ẩn.

Theo chia sẻ từ Google: “Thuật toán nội dung hữu ích được thiết kế để hiển thị nhiều nội dung hữu ích hơn trong kết quả tìm kiếm, được tạo ra để trợ giúp hoặc thông báo cho mọi người, các nội dung được tạo ra chỉ để có được vị trí xếp hạng tốt hơn trên Google tìm kiếm sẽ ít được xuất hiện hơn.”

“Chúng tôi không nhắm mục tiêu nội dung được sản xuất bằng bất kỳ phương pháp cụ thể nào – dù là AI hay cách khác – chúng tôi chỉ quan tâm đến chất lượng của một website nhất định và sự hữu ích của nó đối với người đọc.”

Trong khi mục tiêu chính của Google dường như là hạ thấp thứ hạng các website sử dụng lại nội dung hay sắp xếp lại những thông tin đã có sẵn trên môi trường trực tuyến nhằm mục đích xếp hạng cao hơn trong trang kết quả tìm kiếm.

Vấn đề là các mô hình ngôn ngữ lớn (LLMs) như PaLM 2 hay Llama 2, vốn được đào tạo dựa trên khối lượng lớn nội dung được lấy miễn phí từ Internet. Vì vậy, về bản chất, các mô hình AI này đang khéo léo dùng lại những gì đã được xuất bản trước đó. Đó phải là điều mà Google trừng phạt.

Mặc dù vậy, với những gì mà Google đang làm, nó đang được hiểu theo cách ngược lại, Google vẫn ưu tiên cho các nội dung do AI tạo ra miễn là nó “có chất lượng” theo cách hiểu của các thuật toán của Google.

Theo quan điểm của Minara, rõ ràng là Google vẫn đang sử dụng “chiến lược nước đôi”, một mặt, Google nói rằng nội dung AI vẫn ổn, nhưng mặt khác, lại ưu tiên các nội dung hữu ích và nội dung gốc đồng thời khuyến cáo các website sử dụng các công cụ AI để viết nội dung SEO.

Phát hiện ra các nội dung AI là không thể.

Với những gì đang diễn ra, một vấn đề đối với cả người dùng và Google là, công cụ tìm kiếm hiện tại không thể nhận ra sự khác biệt giữa nội dung do máy tạo ra và do con người tạo ra.

Trong khi Google như đã thông báo là sẽ giảm thứ hạng và trừng phạt các nội dung thiếu tính hữu ích hay kém chất lượng, công cụ tìm kiếm lại chưa thể đưa ra các giải pháp cụ thể về cách họ phát hiện và phân biệt các nội dung AI.

Mặc dù lợi ích do các công nghệ AI tạo ra là quá rõ ràng, việc ứng dụng nó ra sao vào các bối cảnh cụ thể vẫn còn là một bài toán khó chưa có lời giải đáp.