Khi AI phát triển, tin tức không chỉ dành cho con người đọc
Nội dung báo chí không còn chỉ là bài viết để người đọc tiếp nhận, mà còn là dữ liệu có thể được máy móc đọc, xử lý, phân tích và phân phối theo nhiều cách.
Associated Press biến tin tức thành dữ liệu cho máy đọc
Tại một hội thảo chuyên sâu về AI tác nhân (Agentic AI) dành cho ngành truyền thông do INMA tổ chức trong khuôn khổ Sáng kiến Sản phẩm & Công nghệ, các lãnh đạo từ Associated Press, Schibsted, Scroll và IAB Tech Lab đã chia sẻ cách AI đang khiến các nhà xuất bản phải suy nghĩ lại về cách sản xuất nội dung và cách đưa nội dung đó lên web.
Một ví dụ rõ ràng đến từ hãng tin Associated Press. Cuối năm 2025, hãng thông tấn này khởi động sáng kiến chiến lược mang tên AP Intelligence nhằm chuyển đổi kho lưu trữ khổng lồ và các bản tin thời gian thực của mình thành dữ liệu có cấu trúc để máy có thể đọc và xử lý.
Theo bà Sara Trohanis, Phó Chủ tịch phụ trách doanh thu khu vực châu Mỹ và người đứng đầu quan hệ đối tác chiến lược của Associated Press, mục tiêu là thay đổi cách nhìn về tin tức.
“Chúng tôi đang xem tin tức như một nguồn dữ liệu và khai thác tiềm năng đó để đưa thông tin đến nhiều ngành công nghiệp và đối tượng độc giả mới”, bà nói, đồng thời cho rằng cách tiếp cận này có thể tạo ra “nguồn dữ liệu tin tức được xác thực hàng đầu thế giới”.
Theo bà Trohanis, mỗi bài báo thực chất chứa rất nhiều dữ liệu có giá trị. Một bản tin về cháy rừng, chẳng hạn, không chỉ là câu chuyện tường thuật mà còn bao gồm nhiều yếu tố như địa điểm, thời gian, số người thương vong, tác động kinh tế, điều kiện thời tiết và bối cảnh lịch sử.
Con người đọc bài báo theo cách kể chuyện. Nhưng các hệ thống AI lại tiếp nhận thông tin khác. “Chúng tiếp nhận các thực thể, dấu thời gian, vị trí địa lý và các mối quan hệ siêu dữ liệu”, bà giải thích.
Vì vậy, nếu nội dung báo chí được cấu trúc theo cách mà máy có thể hiểu được, giá trị của nó có thể được mở rộng sang nhiều lĩnh vực khác, đặc biệt là những ngành cần thông tin được xác thực và cập nhật theo thời gian thực để đưa ra quyết định.
Thông qua AP Intelligence, Associated Press đang bổ sung siêu dữ liệu, cấu trúc và bối cảnh cho văn bản, ảnh, video, âm thanh và cả kho lưu trữ nội dung. Theo bà Trohanis, mục tiêu là giúp các hệ thống dữ liệu khác có thể tích hợp thông tin báo chí một cách dễ dàng hơn theo thời gian thực.

Sự xuất hiện của AI tác nhân (Agentic AI) khiến nội dung báo chí không chỉ để đọc mà còn trở thành dữ liệu để máy xử lý, phân tích và phân phối.
Schibsted phát triển AI tự động tạo video từ bài báo
Trong khi đó, tại tập đoàn truyền thông Schibsted, AI đang được sử dụng trực tiếp trong quá trình sản xuất nội dung.
Ông Juan Carlos Lopez Calvet, Giám đốc dữ liệu và AI của Schibsted, đã trình diễn một công cụ mang tên Videofy, hiện đang ở phiên bản thứ 10. Công cụ này có thể tổng hợp nội dung từ thư viện dữ liệu của tòa soạn để tạo ra các video tin tức.
Theo ông Lopez Calvet, hệ thống có thể tiếp nhận nhiều dạng dữ liệu khác nhau như bài viết, văn bản, video hoặc âm thanh. Sau đó AI sẽ xử lý các nguồn này để tạo ra sản phẩm đầu ra, chẳng hạn một video tin tức.
Các tác nhân AI của Schibsted còn có thể tự động thu thập và tổng hợp các câu chuyện liên quan từ nhiều nguồn. Ví dụ, một sự kiện thể thao lớn tại Thế vận hội mùa đông có thể tạo ra nhiều bài báo, ảnh và video. AI sẽ lựa chọn các nguồn phù hợp từ hệ thống dữ liệu của tòa soạn để xây dựng nội dung.
Trong bản trình diễn, nhóm đã tạo một video tổng hợp hàng chục bài báo liên quan đến vụ án Jeffrey Epstein. Người dùng có thể chọn mẫu video, chọn ngôn ngữ và chỉnh sửa nhiều yếu tố như đoạn mở đầu, số lượng cảnh quay hay lời dẫn.
Ý tưởng video ban đầu được tạo ra bằng cách lấy hình ảnh và âm thanh có sẵn trong kho dữ liệu của tòa soạn thông qua một hệ thống kết nối nội dung. Sau đó, người dùng có thể chỉnh sửa các chi tiết như hình ảnh, lời dẫn hoặc cấu trúc video trước khi tải xuống và đưa vào hệ thống quản lý nội dung của tòa soạn (CMS) để xuất bản.
Scroll biến một bài báo thành nhiều định dạng nội dung
Một cách tiếp cận khác đến từ Scroll, tổ chức truyền thông tại Ấn Độ. Nhóm nghiên cứu AI Lab News & Journalism của Scroll cho rằng nội dung báo chí có thể được chia nhỏ thành các “đơn vị thông tin”.
Bà Sannuta Raghu, trưởng nhóm AI Lab, cho biết cách tiếp cận này giúp nội dung linh hoạt hơn và có thể được chuyển đổi sang nhiều định dạng khác nhau theo nhu cầu.
Theo bà Raghu, thay vì xem mỗi bài báo là một đơn vị nội dung hoàn chỉnh, tòa soạn có thể chia nhỏ kiến thức báo chí thành nhiều phần chi tiết và lưu trữ chúng theo cấu trúc phù hợp.
Scroll đã phát triển một công cụ mang tên Factivo để thực hiện điều này. Công cụ có thể lấy một bài báo đã được xác minh và chuyển đổi thành nhiều định dạng khác nhau như video, dòng thời gian, máy tính dữ liệu, sơ đồ tư duy hoặc phần hỏi đáp.
Ví dụ, khi đưa tin về các trận lũ lụt lớn, Scroll đã xuất bản khoảng 20 bài báo liên quan. Nhờ Factivo, nhóm có thể kết nối các bài viết này để tạo thành một dòng thời gian đầy đủ về sự kiện.
Theo bà Raghu, khi thông tin được tổ chức theo các “đơn vị nhỏ”, nó có thể được tái sử dụng theo nhiều cách khác nhau cho người dùng.
Khi máy móc trở thành “độc giả” chính của web
Trong khi đó, một vấn đề khác mà các tòa soạn phải đối mặt trong kỷ nguyên AI là sự thay đổi của lưu lượng truy cập trên web.
Ông Shailley Singh, Phó Chủ tịch điều hành sản phẩm kiêm Giám đốc điều hành IAB Tech Lab, cho biết trong nhiều thập kỷ, các nhà xuất bản tin tức hoạt động dựa trên giả định rằng người dùng sẽ trực tiếp truy cập vào các trang web.
Theo ông Singh, giả định này đang thay đổi. Hiện nay, phần lớn lưu lượng truy cập trên web không đến từ con người mà đến từ các hệ thống tự động như tác nhân AI và trình thu thập dữ liệu.
“Hơn 51% lưu lượng truy cập web không phải do con người thực hiện”, ông nói. Điều đó có nghĩa là các hệ thống AI không chỉ đọc tin tức mà còn có thể diễn giải và phân phối lại thông tin trên quy mô lớn.
Trong bối cảnh đó, ông Singh cho rằng các nhà xuất bản cần những phương pháp xác minh mạnh mẽ hơn để kiểm soát quyền truy cập vào nội dung.
Một giải pháp được đề xuất là sử dụng mã truy cập điện tử. Khi một tổ chức được phép sử dụng nội dung theo thỏa thuận cấp phép, họ sẽ được cấp một mã xác nhận riêng, giống như một chữ ký điện tử.
Khi hệ thống nhận được yêu cầu truy cập, nó sẽ kiểm tra mã này. Nếu mã hợp lệ, tổ chức đó sẽ được phép sử dụng nội dung. Nếu không, yêu cầu truy cập sẽ bị chặn. Theo ông Singh, cách này giúp các nhà xuất bản tin tức kiểm soát chặt chẽ hơn việc ai được phép sử dụng nội dung của mình.







