رونمایی از مدلهای زبانی فارسی همراه اول؛ مدلهای زبانی فارسی توسعهیافته توسط همراه اول که با هوش مصنوعی قادر به تحلیل و یادگیری حجم زیادی از دادههای متنی هستند در الکامپ 1403، رونمایی شدند.
به گزارش اقتصادمند، گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بینالمللی الکامپ 1403، تعدادی از مدلهای زبانی توسعهیافته خود شامل سیلک (با 1.3میلیارد پارامتر)، آهوران (با 8 میلیارد پارامتر) و آوا (با 13 میلیارد پارامتر) را با حضور عیسی زارعپور، وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی همراه اول (سالن 35)، رونمایی کرد.
مدلهای زبانی بزرگ (LLM)، شبکههای هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از دادههای متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافتهاند.
مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر به نسبت کم، قابلیت زبانی خوبی را به نمایش میگذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.
مدل آهوران بر پایه مدل چندزبانه Llama3 شرکت Meta و به صورت آموزش ادامهدار (continual pretraining) روی یک مجموعه دادگان فارسی توسعه داده شده است. باتوجه به قابلیتهای زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیتهای دیگر مدل تا حد زیادی حفظ شده است.
کاربردهای تجاری این مدلها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت باتها، تحلیل احساسات و نظرات کاربران در شبکههای اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدلها میتوانند به شرکتها در افزایش بهرهوری، کاهش هزینهها و بهبود تجربه مشتری کمک کنند.
مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.
برخلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارایه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز میکند؛ استفاده اصلی این مدل در رباتهای پاسخگوی خاص منظوره است.
علاوه بر آموزش این مدلها، تلاش شده است تا به کمک روشهای همترازسازی (RLHF و DPO) از تولید محتوای آسیبزا جلوگیری شود.
بنابر اعلام اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext همراه اول تلاش دارد تا در آینده نزدیک امکان استفاده عمومی از این مدلها را نیز فراهم کند.
لینک خبر: https://eghtesadmand.ir/?p=571798