Alibaba ra mắt mô hình AI mã nguồn mở có thể phân tích cảm xúc con người qua video

  • Cập nhật: Thứ năm, 13/3/2025 | 10:51:18 AM

Tập đoàn Alibaba của Trung Quốc vừa ra mắt mô hình trí tuệ nhân tạo (AI) mới, được cho là có khả năng nhận diện cảm xúc con người thông qua video, với tham vọng vượt qua mô hình mới nhất của OpenAI.

Tập đoàn Alibaba của Trung Quốc vừa ra mắt mô hình trí tuệ nhân tạo (AI) mới.
Tập đoàn Alibaba của Trung Quốc vừa ra mắt mô hình trí tuệ nhân tạo (AI) mới.

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI.

Nhóm phát triển cho biết, họ đã sử dụng RLVR để tối ưu hoá mô hình mã nguồn mở HumanOmni 0.5B, giúp cải thiện đáng kể 3 yếu tố quan trọng, gồm khả năng suy luận, độ chính xác trong nhận diện cảm xúc và khả năng tổng quát hoá. Theo báo cáo, R1-Omni có thể hiểu rõ hơn cách thông tin thị giác và thính giác hỗ trợ việc nhận diện cảm xúc, đồng thời xác định rõ yếu tố nào đóng vai trò quan trọng hơn trong việc đánh giá từng loại cảm xúc.

Trong các video thử nghiệm, R1-Omni có thể xác định trạng thái cảm xúc của con người thông qua video, đồng thời mô tả trang phục và môi trường xung quanh nhân vật. Điều này đánh dấu một bước tiến lớn trong lĩnh vực thị giác máy tính.

Công nghệ nhận diện cảm xúc của AI đang dần trở thành một xu hướng quan trọng trong ngành công nghệ. Công nghệ này thường thấy qua các ứng dụng thực tế, như chatbot hỗ trợ khách hàng hay hệ thống giám sát, phát hiện dấu hiệu mệt mỏi của tài xế khi lái xe trên xe điện Tesla.

Với việc ra mắt mô hình R1-Omni, Alibaba đang tăng tốc trong cuộc đua AI và thách thức vị thể của OpenAI. Trong khi OpenAI ra mắt GPT-4.5 có khả năng nhận diện và phản hồi những tín hiệu tinh tế trong câu hỏi của người dùng, với mức giá lên tới 200 USD/tháng, Alibaba lại cung cấp R1-Omni hoàn toàn miễn phí trên nền tảng Hugging Face.

Mặc dù hiện tại R1-Omni mới chỉ nhận diện các cảm xúc cơ bản như "vui” hay "giận dữ”, nhưng theo CEO của Alibaba Ngô Dũng Minh, trí tuệ nhân tạo tổng quát (AGI) là mục tiêu hàng đầu của công ty, và phát triển trí tuệ cảm xúc cho AI chính là một bước tiến quan trọng.

(Theo VOV)

Các tin khác
Sao Thổ đã bỏ xa Sao Mộc, với tổng cộng 274 mặt trăng, gần gấp đôi số lượng mặt trăng của tất cả các hành tinh khác cộng lại.

Các nhà thiên văn học vừa phát hiện thêm 128 mặt trăng mới quay quanh sao Thổ, nâng tổng số mặt trăng của sao Thổ lên 274. Điều này khiến sao Thổ trở thành hành tinh dẫn đầu về số lượng mặt trăng trong hệ Mặt Trời, vượt qua cả sao Mộc.

Ảnh minh hoạ.

Việt Nam sẽ trở thành điểm đến của khoảng 1.000 chuyên gia và CEO từ các công ty công nghệ lớn để thảo luận về AI và chất bán dẫn vào tuần này.

Mọi người tập yoga vào sáng sớm tại vườn Lodhi khi một lớp sương mù dày bao phủ New Delhi, Ấn Độ.

Báo cáo thường niên của IQAir cho thấy hầu hết các quốc gia có mức ô nhiễm không khí cao hơn nhiều so với khuyến nghị của Tổ chức Y tế Thế giới (WHO).

AI vẫn chưa thể thay thế con người.

Nỗi sợ hãi về AI ngày càng gia tăng khi truyền thông tràn ngập những cảnh báo từ các chuyên gia rằng AI có thể thay thế con người, khiến nhiều người dù được đào tạo bài bản vẫn có nguy cơ trở nên vô dụng.

Xem các tin đã đưa ngày:
Tin trong: Chuyên mục này Mọi chuyên mục