برای استفاده از هوش مصنوعی، سرویسهای مختلفی وجود دارند. یکی از سرویسهای محبوب و رایگان، Ollama است که به کمک آن میتوانید مدلهای زبانی بزرگ را روی سیستم خود اجرا کنید. در ادامه یاد میگیرید چگونه این سرویس را نصب کرده و از طریق روشهای مختلف با آن ارتباط برقرار کنید.
معرفی Ollama
اگر قصد دارید مدلهای زبانی بزرگ (LLM) را روی سیستم خود اجرا کنید، یکی از راحتترین روشها استفاده از پلتفرم Ollama است. اولاما یک پلتفرم اوپنسورس است که به شما اجازه میدهد بدون نیاز به سرورهای قوی یا دانش فنی، مدلهای زبانی مختلف را به راحتی دانلود، نصب و استفاده کنید.
استفاده از اولاما رایگان است و شما بدون هیچ هزینه یا محدودیتی میتوانید از مدلهای زبانی مختلف استفاده کنید.
این پلتفرم امنیت بالایی دارد. اگر اطلاعات خصوصی یا حساسی دارید که نمی خواهید با دیگران به اشتراک بگذارید استفاده از این روش گزینه مناسبی است. چون بر خلاف سرویسهایی مثل چتGPT که اطلاعات شما به سرورهای آن ارسال می شوند، در اولاما مدل های زبانی مستقیما روی سیستم شما نصب شده و بدون نیاز به اینترنت اجرا می شوند. به این ترتیب اطمینان دارید که اطلاعات شما تحت هیچ شرایطی به سرورهای خارجی ارسال نخواهند شد.
گام اول: نصب اولاما
برای استفاده از مدلهای زبانی اول باید اولاما رو نصب کنید. به سایت ollama.com رفته و نسخه مناسب با سیستم عامل خود را دانلود و نصب کنید. (نصب آن آسان است و تنظیم خاصی ندارد)
بعد از نصب، آیکون برنامه به منوی start ویندوز اضافه میشود. روی آن کلیک کنید تا اجرا شود. بعد از کلیک صفحه خاصی باز نمی شود، فقط اولاما در حالت اجرا قرار گرفته و آیکون برنامه در نوار وظیفه ویندوز اضافه میشود.
گام دوم: نصب مدلها
بعد از نصب، باید مدل زبانی مدنظر خود را دانلود کنید. در ollama.com/library می توانید فهرست همه مدل ها را مشاهده کنید. در صفحه گیت هاب اولاما یک جدول وجود دارد که حجم و مقدار پارامتر هر مدل را توضیح داده است.
طبق توضیح اولاما برای مدلهای 7B باید حداقل 8 گیگ رم، مدلهای 13B حداقل 16 گیگ رم و مدلهای 33B حداقل 32 گیگ رم داشته باشید. هر چه قدر حجم مدل بیشتر باشد پردازش آن هم طولانیتر میشود. اگر سیستم قوی ندارید، از مدلهای کوچکتر استفاده کنید.
مدل خود را انتخاب کرده و به صفحه مخصوص آن بروید. مثلا من قصد دارم مدل llama3.1 را اجرا کنم.
برای دانلود مدل کافیست کامند ollama run llama3.1
را در ترمینال وارد کنید. بعد از تکمیل دانلود مدل آماده اجرا است و در همان ترمینال میتوانید با آن چت کنید.
برای مشاهده مدلهای نصب شده می توانید از دستور ollama list
و برای دیدن مدل در حال اجرا از دستور ollama ps
استفاده کنید.
مدل های دانلود شده در مسیر C:\Users\%username%\.ollama\models
قرار میگیرند. برای حذف مدلهای نصب شده به جای حذف آنها از این پوشه بهتر است از دستور ollama rm model-name
استفاده کنید.
موارد بیشتر را می توانید در صفحه گیت هاب یا سوالات متداول مطالعه کنید.
آیا مدلها از زبان فارسی پشتیبانی می کنند؟
بله، بعضی از مدلها از زبان فارسی پشتیبانی میکنند و اگر پرامپت فارسی بنویسید پاسخ شما را به زبان فارسی مینویسند. مدل llama3.1 و gemma2 نسبتا خوب است. مدل qwen2 هم معمولی است. مدل command r plus هم عملکرد خوبی دارد.
یک مدل هم هست به اسم dorna-llama3 که توسط «مرکز تحقیقات هوش مصنوعی پارت» روی داده های فارسی آموزش دیده.(+) البته توقع نداشته باشید که این مدل بهتر از مدل های دیگر باشد. در حال حاضر مدل llama3.1 عملکرد بسیار بهتری از درنا دارد که روی نسخه 3 آموزش دیده.1
اگر شما مدلهای دیگری را تست کردید و نتیجه بهتری گرفتید میتوانید در کامنتهای همین صفحه به اشتراک بگذارید.
گام سوم: استفاده از محیطهای تعاملی
چت کردن با مدلها در محیط ترمینال کمی پیچیده است و به همین خاطر ممکن است برای همه راحت و جذاب نباشد. خوشبختانه با استفاده از افزونهها و پلاگینهای مختلف میتوانیم از محیط های تعاملی پیشرفته تری استفاده کنیم. این محیطها امکان دسترسی آسانتر به قابلیتهای مدل را فراهم میکنند و به کاربران اجازه میدهند بدون نیاز به دستورات پیچیده، از تواناییهای مدل به بهترین شکل استفاده کنند. موارد مختلف و متعددی از این رابطها وجود دارد که در اینجا به چند مورد از آنها اشاره میکنم.
افزونه Page Assist
راحت ترین و پر امکانات ترین روش استفاده از افزونه Page Assist است که بدون دردسر روی مروگر شما نصب می شود. یک رابط کاربری ساده دارد که بدون مشکل می توانید در آن چت کنید.
بخشی از امکانات این افزونه:
- رابط کاربری فارسی
- امکان جستجو در وب
- چت کردن بر اساس یک صفحه وب مشخص (حالت side panel)
- مدیریت مدلها :دانلود، آپدیت و حذف مدل
- مدیریت دانش :جستجو در دیتای شما با رویکرد RAG
- مدیریت پرامپت :ساخت پرامپت از پیش تعریف شده
- ذخیره تاریخچه چت، امکان حذف سابقه
- اشتراک گذاری چت به صورت عمومی
- ایمپورت و اکسپورت گرفتن از دادهها (سابقه چت، پرامپتها و پایگاه دانش)
استفاده
برای نصب به صفحه گیتهاب Page Assist مراجعه کنید.
آموزش استفاده از این افزونه را هم میتوانید در این ویدئو مشاهده کنید: This Chrome Extension Surprised Me
رابط Open WebUI
با Open WebUI یک رابط کاربری مشابه چتGPT خواهید داشت. به راحتی می توانید مدل های مختلف را انتخاب و چت کنید. مشابه افزونه قبلی از امکانات مختلفی پشتیبانی می کند: مدیریت دانش(RAG)، مدیریت مدلها، مدیریت پرامپتها، ذخیره تاریخچه چت، رابط کاربری فارسی و غیره.
استفاده
برای نصب به صفحه گیتهاب Open WebUI مراجعه کنید. (اگر قصد دارید از پایتون برای نصب این رابط کاربری استفاده کنید حتما باید از نسخه 3.11 استفاده کنید. اگر فایل اینستالر این نسخه را پیدا نکردید میتوانید از آرشیو آن را دانلود کنید.)
علاوه بر روش های نصبی که داخل این صفحه گفته شده می توانید از طریق نرم افزار pinokio هم این رابط کاربری را نصب کنید.
پلاگینهای ابسیدین
اگر از نرم افزار ابسیدین استفاده میکنید میتوانید به راحتی با نصب یک پلاگین از مدلهای زبانی در محیط این نرمافزار استفاده کنید. این پلاگین ها عبارت اند از:
- Local GPT
- Text Generator
- Smart Second Brain
- Copilot
- BMO Chatbot
- Quiz Generator
در یادداشت استفاده از هوش مصنوعی در ابسیدین این پلاگینها را به طور مفصل معرفی و بررسی کردم.
مطالب مرتبط
نوشتههای مرتبط با این موضوع را میتوانید در 🧠 هوش مصنوعی مشاهده کنید.