Chúng ta đều đã thấy rất nhiều video do AI tạo ra lan truyền trên mạng xã hội. Hầu hết chỉ là lý thuyết Internet lỗi thời ở mức tệ nhất. Tất nhiên, cũng có một số video thực sự xuất sắc, nhưng cho đến gần đây, việc phát triển chúng rất tốn kém về thời gian, token, hoặc thậm chí cả phần cứng cần thiết.
Google đã quyết định thay đổi điều đó. Hãng đã tung ra các sản phẩm AI cho mọi lĩnh vực chính và Veo là câu trả lời của họ cho video do AI tạo ra. Nó thực sự ấn tượng.
Điều thú vị – theo một cách nào đó – là một số dữ liệu huấn luyện của Veo đến từ YouTube. Google không giải thích rõ điều đó nghĩa là gì, nhưng bạn có thể tự suy luận theo cách riêng của mình.
Trong mọi trường hợp, Veo 3 dường như là một bước đột phá lớn: Giờ đây bạn có thể kết hợp tạo âm thanh cùng với tạo video, theo cách mà video của bạn không hề vi phạm các định luật vật lý.
Google Veo là gì?
Google Veo là một nhóm các mô hình tạo video bằng trí tuệ nhân tạo (AI) có thể tạo video từ những prompt văn bản hoặc từ ảnh tĩnh. Mô hình mới nhất, Veo 3, bao gồm cả khả năng tạo âm thanh gốc cùng với video (mô hình trước đó, Veo 2, chỉ tạo ra các clip không có âm thanh).
Khả năng tạo âm thanh gốc, mô phỏng vật lý thực tế và khả năng hiểu prompt nâng cao là những điểm nổi bật của Veo 3 so với các công cụ tạo video AI khác. Các công cụ tạo video AI khác, như Sora và Runway, hiện chưa có chức năng tạo âm thanh gốc.
Tổng quan về Google Veo 3
Veo 3 thực sự ấn tượng - mọi người đã và đang sử dụng nó để cải tổ chiến lược tiếp thị của họ. Trước khi đi sâu vào cách thức hoạt động và những gì nó có thể làm, đây là một cái nhìn tổng quan nhanh về những điểm mạnh và những điểm cần cải thiện của Veo.
Ưu điểm
- Tạo âm thanh và video gốc với giọng nói tự nhiên và tiếng ồn hoặc nhạc nền
- Mô phỏng vật lý thực tế cho các yếu tố như nước, vải và ánh sáng
- Điều khiển máy quay phim và bố cục cảnh quay xuất sắc
- Hiểu prompt nâng cao, đặc biệt là các tín hiệu tương tác
- Nhiều tùy chọn đầu vào (văn bản, hình ảnh, khung hình)
- Tích hợp trong Flow và Gemini, với giao diện trực quan (đặc biệt là trong Flow)
- Liên tục được cải tiến và đã vượt trội so với các đối thủ như Runway hoặc Sora
Nhược điểm
- Giới hạn độ dài 8 giây
- Tính liên tục của nhân vật không nhất quán giữa các cảnh, ngay cả với prompt chi tiết
- Việc diễn giải prompt khác nhau, khiến việc tạo ra đầu ra lặp lại khó khăn
- Độ chính xác văn bản hạn chế trong các yếu tố hình ảnh (ví dụ: viết sai chính tả)
- Một số lỗi và sự cố khi kết hợp những cảnh quay hoặc chuyển đổi giữa các chế độ
- Hiển thị watermark trừ khi bạn trả phí cho gói Ultra (249,99 USD/tháng)
Có thể truy cập Veo 3 ở đâu?
Veo 3 có sẵn trên cả chatbot Gemini và Flow, ứng dụng làm phim AI của Google (sử dụng Flow dễ hơn).
Nó cũng dễ truy cập hơn trên Flow vì Gemini chỉ cung cấp cho người đăng ký Google AI Pro 10 video Veo 3 dùng thử, trong khi Flow cung cấp 100 video mỗi tháng với cùng gói dịch vụ.
Flow cũng được thiết kế chuyên dụng cho việc tạo video với các công cụ chuyên nghiệp như:
- Điều khiển máy quay để định hướng khung hình chính xác
- Khả năng xây dựng cảnh
- Quản lý và tổ chức dự án
Đây là một ví dụ về video clip với các điều khiển máy quay:
Ngoài ra, cần lưu ý một số hạn chế về mặt địa lý, cụ thể là Flow chưa có sẵn ở khắp mọi nơi. Bạn chỉ có thể sử dụng Veo 2 thông qua Gemini. Ngoài ra, nó có sẵn ở hơn 70 quốc gia, bao gồm Mỹ, Canada, Úc, Anh và Ấn Độ.
Giá Google Veo
Bạn cần truy cập Google Veo thông qua gói đăng ký Google rộng hơn, cụ thể là:
- Google AI Pro (19,99 USD/tháng) cung cấp cho bạn 1.000 AI credit hàng tháng. Đối với Flow, đó là 100 credit cho Veo 3 Quality, 20 credit cho Veo 3 Fast và 10 credit cho Veo 2 Fast.
- Google AI Ultra (249,99 USD/ tháng) cung cấp cho bạn 12.500 AI credit hàng tháng, quyền truy cập sớm vào các tính năng mới và không có watermark hiển thị. Đáng chú ý, đây là gói duy nhất không bao gồm watermark (khách hàng trả phí Pro không thực sự hài lòng về điều này).
Người đăng ký Ultra cũng được truy cập vào Ingredients to Video. Tính năng này cho phép bạn thêm những yếu tố riêng lẻ (nhân vật, đối tượng, hình nền) một cách riêng biệt và kết hợp chúng thành các cảnh để có tính nhất quán tốt hơn giữa những cảnh quay.
Cách tạo video đầu tiên với Veo 3
Sau khi đăng ký gói Google AI Pro hoặc Ultra, hãy truy cập Flow (khuyên dùng) hoặc sử dụng ứng dụng Gemini.
Dưới đây là cách bắt đầu sử dụng Google Veo trong Flow:
- Nhấp vào trường prompt và mô tả chi tiết cảnh quay của bạn. Bao gồm các chi tiết cụ thể: bối cảnh, nhân vật, hành động và góc máy quay.
- Đối với lời thoại, hãy sử dụng dấu ngoặc kép, ví dụ: "Nhân vật nói 'lời thoại cụ thể'".
- Thêm các dấu hiệu tương tác, ví dụ: "nhìn thẳng vào nhau" hoặc "gật đầu đồng ý".
- Chỉ định âm thanh, chẳng hạn như loại nhạc nền, âm thanh môi trường, v.v...
Sau khi thiết lập mọi thứ theo sở thích của bạn, hãy tạo video và chờ kết quả cuối cùng, thường sẽ có trong vòng vài phút.
Dưới đây là một vài mẹo:
- Tránh sử dụng chữ in hoa để nhấn mạnh. Điều này gây nhầm lẫn cho quá trình tạo âm thanh.
- Hãy cực kỳ cụ thể về tương tác giữa các nhân vật để tránh tình trạng nhân vật cứ nhìn chằm chằm vào máy quay như đã đề cập trước đó.
- Đối với các chuỗi nhiều cảnh quay, hãy chấp nhận việc thay đổi cảnh thay vì cố gắng duy trì tính nhất quán.
- Hãy thử nghiệm các biến thể khác nhau của cùng một prompt để tìm ra phương pháp hiệu quả.
Và một vài lưu ý về các hạn chế:
- Mỗi video đều bị giới hạn ở 8 giây, điều này hạn chế nghiêm trọng khả năng kể chuyện. Bạn không thể phát triển các câu chuyện phức tạp hoặc thể hiện những quy trình chi tiết.
- Người dùng Google AI Pro sẽ thấy watermark hiển thị trên tất cả nội dung được tạo ra. Chỉ những người đăng ký Ultra (250 USD/ tháng) mới tránh được việc này.
- Khi tác giả cung cấp một khung hình chứa báo cáo lãi lỗ, Veo 3 đã thêm các lỗi văn bản như "Expensestes" thay vì "Expenses". Trí tuệ nhân tạo gặp khó khăn trong việc tạo văn bản chính xác trong các cảnh. Tuy nhiên, các mô hình xử lý hình ảnh ban đầu của OpenAI cũng vậy - chắc chắn rằng đây sẽ không phải là vấn đề lâu dài.
Veo chưa sẵn sàng cho các dự án hoàn chỉnh từ đầu đến cuối, nhưng ý tưởng và các thử nghiệm ban đầu chắc chắn rất hứa hẹn. Và việc thử nghiệm những điểm chưa hoàn thiện của nó ngay bây giờ sẽ giúp bạn hình dung cách tinh chỉnh và tăng tốc quá trình tạo video trong tương lai khi công nghệ phát triển hơn.
Làm chủ AI
Học IT










Microsoft Word 2013
Microsoft Word 2007
Microsoft Excel 2019
Microsoft Excel 2016
Microsoft PowerPoint 2019
Google Sheets
Lập trình Scratch
Bootstrap
Ô tô, Xe máy