
CHI PHÍ ĐỂ TẠO RA MỘT HÌNH BẰNG AI
Sau khi chia sẻ nhẹ về tính năng tạo hình bằng AI, thì nhiều anh chị em cũng có hỏi là chi phí “tạo” ra một hình là bao nhiêu, thì sẵn tiện Tuấn chia sẻ để mọi người hình dung cách 1 công ty (ví dụ như Google) tính tiền bạn để tạo ra một hình.
Bất kỳ khi muốn một AI model tạo ra một cái gì đó (ví dụ văn bản, hình ảnh, âm thanh, video..) thì bạn chỉ cần quan tâm các yếu tố ảnh hưởng đến chi phí như sau:
1. Sử dụng Model gì.
2. Độ dài của đầu vào (Số lượng Input Token).
3. Độ dài của kết quả (Số lượng Output Token).
—
Tuấn sẽ lấy ví dụ cho tính năng mình chia sẻ, và trong ví dụ đang dùng model tốt nhất hiện tại của Google khi tạo hình.
1. Sử dụng Model Gemini 2.5 Flash Image. Mỗi model đều có bảng giá riêng cho phần 2 và phần 3.
2. Độ dài của đầu vào. Tức là độ dài của Prompt bạn nhập vào và độ dài của các hình bạn gửi lên. “Độ dài” trong thuật ngữ của AI nó gọi là Token. Tức là mình sẽ tính số token gửi lên chính là số token của đoạn text và số token của các hình.
Đối với văn bản thì sẽ có cách tính số token khác với hình. Ví dụ một câu văn viết bằng Tiếng Việt dài khoảng 10 từ thì tính ra bằng khoảng 15-20 token (do thuật toán tính toán, và hoàn toàn dự đoán được).
Đối với hình ảnh, thì các model của google (Gemini) tính dựa theo độ phân giải của hình. Một vùng diện tính 768×768 px được coi là tương đương 258 token. Ví dụ 1 hình có kích thước 1024×1024 px gửi lên sẽ có thể coi là 4 x 258 token.
Tổng hợp hết token từ văn bản và hình ảnh gửi lên thì sẽ ra tổng số token input. Và giá của Input token khá rẻ, hiện tại với Gemini thì từ $0.3 -> $0.5 cho một triệu token (Bạn không đọc sai, MỘT TRIỆU TOKEN), nên chúng ta không cần quan tâm nhiều về giá của token input.
3. Độ dài của kết quả. Với tính năng tạo hình như demo, thì Gemini 2.5 đang tính một hình tạo ra sẽ tương đương với 1290 token. Giá của token tạo hình là khoảng $30 cho một triệu token (gấp khoảng 100 lần so với đầu vào). Do đó, tính ra thì một hình sẽ khoảng…1.000VND.
Hiện tại, do mỗi lần tạo đều tốn chi phí, nên các công ty chuyên nghiệp đều phải thông qua cơ chế API của Google (hoặc các công ty khác như OpenAI..) để kiểm soát việc tạo hình, chi phí cũng như cấp ngân sách cho từng nhân viên, từng công ty để đảm bảo không mất kiểm soát.
Ngoài ra, một lý do khác của việc thông qua cơ chế kiểm soát để tránh nhân viên sử dụng bừa bãi API cho việc riêng, như là tất cả API tạo hình ảnh (hoặc tex) đều được đính kèm System Prompt, là một dạng đoạn văn bản được tự động thêm vào nội dung Prompt cho nhân viên, trước khi gọi qua Google API, để đảm bảo nội dung và kết quả của prompt chỉ phục vụ cho mục đích tạo content cho tổ chức.
Vài chia sẻ để các anh chị em doanh nghiệp muốn ứng dụng AI vào doanh nghiệp một cách an toàn và có kiểm soát. Tránh việc nhân viên “lạm dụng” AI để làm việc riêng, hoặc đưa nhân viên 500k kêu là nạp tiền vào tài khoản cá nhân, muốn làm gì làm :).
Enjoy prompting!
–
Home