Google ra mắt tính năng dịch giọng nói trực tiếp trên Google Meet
Tại hội nghị công nghệ Google I/O 2025 diễn ra vào ngày 21/5/2025, Google đã công bố tính năng dịch giọng nói thời gian thực tiên tiến trên ứng dụng Google Meet.
Tính năng mới hứa hẹn xóa bỏ rào cản ngôn ngữ và mang đến trải nghiệm trò chuyện tự nhiên hơn bao giờ hết. CEO Sundar Pichai mô tả đây là “công nghệ đột phá, giúp con người kết nối vượt qua mọi giới hạn ngôn ngữ”.
Tính năng mới cho phép dịch giọng nói trực tiếp trong các cuộc gọi video trên Google Meet, tái tạo chính xác giọng nói, ngữ điệu, và thậm chí cả cảm xúc của người nói với độ trễ tối thiểu. Trong đoạn video giới thiệu tại Google I/O, một người nói tiếng Tây Ban Nha được AI chuyển giọng sang tiếng Anh một cách mượt mà, và ngược lại, trong khi âm thanh gốc vẫn được giữ ở mức âm lượng thấp để đảm bảo tính chân thực.
CEO Pichai trình diễn tính năng mới tại sự kiện. Video: Google
Ông Pichai nhấn mạnh: “Công nghệ này đưa chúng ta đến gần hơn với những cuộc trò chuyện tự nhiên, bất kể ngôn ngữ nào”.
Tính năng này đặc biệt hữu ích cho các gia đình có người thân sinh sống ở các quốc gia khác nhau, cũng như các doanh nghiệp đa quốc gia, nơi đồng nghiệp toàn cầu cần giao tiếp hiệu quả. Google khẳng định độ trễ của quá trình dịch là rất thấp, vượt xa các giải pháp hiện có, mang lại trải nghiệm gần như tức thời.
Hiện tại, tính năng dịch giọng nói thời gian thực hỗ trợ hai ngôn ngữ là tiếng Anh và tiếng Tây Ban Nha, chỉ khả dụng cho người dùng các gói Google AI Pro và Ultra.
Google cho biết sẽ bổ sung thêm nhiều ngôn ngữ khác “trong vài tuần tới” và dự kiến mở rộng thử nghiệm cho khách hàng doanh nghiệp sử dụng Google Workspace trong năm 2025. Điều này sẽ giúp các công ty toàn cầu tăng cường kết nối và hợp tác hiệu quả hơn.
Tính năng dịch giọng nói là một phần của dự án Starline, được Google công bố vào năm 2021, với mục tiêu mang đến trải nghiệm gọi video chân thực như gặp mặt trực tiếp. Ngoài công nghệ ngôn ngữ, Starline còn tích hợp hệ thống camera 3D để tái hiện hình ảnh người gọi một cách sống động.
Tại Google I/O 2025, Google cũng giới thiệu Google Beam, một thiết bị phần cứng mới hỗ trợ dự án Starline, giúp nâng cao chất lượng hình ảnh và âm thanh trong các cuộc gọi video. Thiết bị này hứa hẹn sẽ là bước tiến mới trong giao tiếp trực tuyến, đặc biệt khi kết hợp với công nghệ dịch AI.