تو این یادداشت چند تا API رایگان معرفی کردم که می‌تونید باهاشون به مدل‌های زبان بزرگ (LLM) دسترسی داشته باشید و بدون هزینه از هوش مصنوعی استفاده کنید. برای تست یا پروژه های شخصی کاملا جواب میدن. اما ممکنه برای استفاده های سنگین مناسب نباشه و لازم باشه اشتراک تهیه کنید.


OpenRouter

مدل‌ها: مجموعه بزرگی از مدل‌ها از پلتفرم‌های مختلف مثل:

  • DeepSeek
  • Llama
  • Mistral
  • Qwen
  • Google
  • OpenAI

محدودیت: ۲۰ درخواست در دقیقه، ۵۰ درخواست در روز.


Google AI Studio

مدل‌ها: سری

  • Gemini (2.5 Pro, 2.5 Flash, Flash-Lite…)
  • Gemma
  • and embedding.

محدودیت: بین ۵ تا ۳۰ درخواست در دقیقه و ۵۰ تا ۲۵۰ درخواست در روز (بسته به مدل).


Cohere

کوهر مدل‌های امبدینگ خوبی داره و برای RAG بسیار مناسبه.

مدل‌ها:

  • Command-A, Command-R, Command-R+
  • Aya Expanse, Aya Vision
  • and embedding

محدودیت: ۲۰ درخواست در دقیقه، ۱۰۰۰ درخواست در ماه. (توضیحات کامل)


Cerebras

مدل‌ها:

  • Llama3
  • Llama4
  • qwen-3
  • gpt oss (120b)

فقط از همین مدل‌های اپن‌سورس پشتیبانی می‌کنه اما چون روی سرورهای قوی اجرا می شه سرعت خیلی خوبی داره.

محدودیت: تقریباً همه‌ی مدل‌ها سقف ۳۰ درخواست در دقیقه، ۹۰۰ در ساعت و ۱۴,۴۰۰ در روز دارند. محدودیت توکن هم برای بیشتر مدل‌ها حدود ۶۰ تا ۶۴ هزار توکن در دقیقه و ۱ میلیون در ساعت و روز هست.


Groq

مدل‌ها:

  • Meta: Llama 3, Llama 4
  • OpenAI :gpt-oss
  • whisper (تبدیل گفتار به متن)

محدودیت: از ۱۰۰۰ تا ۱۴۴۰۰ درخواست در روز بسته به مدل، محدودیت توکن بین ۶هزار تا ۷۰هزار در دقیقه.


Liara (موقتا غیر فعال شده)

Red0

لیارا پلن رایگان هوش مصنوعی داشت که به خاطر کمبود ظرفیت موقتا غیرفعال شده.

مدل‌ها:

  • GPT-4o-mini
  • Gemini 2.0 Flash

محدودیت: ۱ درخواست در ثانیه، حداکثر توکن روزانه: 100,000 ورودی 10,000 خروجی. بدون پردازش تصویر.


اگر سرویس های بیشتری را میخواهید این ریپازتوری را نگاه کنید:

Free LLM API resources