Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ


Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ

สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น

ทั้ง Qwen-7B และ Qwen-7B-Chat เปิดให้ดาวน์โหลดใช้งานแล้วที่ ModelScope ซึ่งเป็นชุมชนนักพัฒนา AI ของ Alibaba Cloud และที่ Hugging Face

ที่มา: Alibaba

No Description

Leave a Comment