تو این یادداشت چند تا API رایگان معرفی کردم که می‌تونید باهاشون به مدل‌های زبان بزرگ (LLM) دسترسی داشته باشید و بدون هزینه از هوش مصنوعی استفاده کنید. برای تست یا پروژه های شخصی کاملا جواب میدن. اما ممکنه برای استفاده های سنگین مناسب نباشه و لازم باشه اشتراک تهیه کنید.


OpenRouter

مدل‌ها: مجموعه بزرگی از مدل‌ها از پلتفرم‌های مختلف مثل:

  • DeepSeek
  • Llama
  • Mistral
  • Qwen
  • Google
  • OpenAI

محدودیت: ۲۰ درخواست در دقیقه، ۵۰ درخواست در روز.


Google AI Studio

مدل‌ها: سری

  • Gemini (2.5 Pro, 2.5 Flash, Flash-Lite…)
  • Gemma
  • and embedding.

محدودیت: بین ۵ تا ۳۰ درخواست در دقیقه و ۵۰ تا ۲۵۰ درخواست در روز (بسته به مدل).


Cohere

مدل‌ها:

  • Command-A, Command-R, Command-R+
  • Aya Expanse, Aya Vision
  • and embedding

محدودیت: ۲۰ درخواست در دقیقه، ۱۰۰۰ درخواست در ماه. (توضیحات کامل)


Cerebras

مدل‌ها:

  • Llama3
  • Llama4
  • qwen-3
  • gpt oss (120b)

فقط از همین مدل های اپن سورس پشتیبانی می کند. اما چون روی سرورهای قوی اجرا می شود سرعت خوبی دارد.

محدودیت: تقریباً همه‌ی مدل‌ها سقف ۳۰ درخواست در دقیقه، ۹۰۰ در ساعت و ۱۴,۴۰۰ در روز دارند. محدودیت توکن هم برای بیشتر مدل‌ها حدود ۶۰ تا ۶۴ هزار توکن در دقیقه و ۱ میلیون در ساعت و روز است.


Groq

مدل‌ها:

  • Meta: Llama 3, Llama 4
  • OpenAI :gpt-oss
  • whisper (تبدیل گفتار به متن)

محدودیت: از ۱۰۰۰ تا ۱۴۴۰۰ درخواست در روز بسته به مدل، محدودیت توکن بین ۶هزار تا ۷۰هزار در دقیقه.


Liara

مدل‌ها:

  • GPT-4o-mini
  • Gemini 2.0 Flash

محدودیت: ۱ درخواست در ثانیه، حداکثر توکن روزانه: 100,000 ورودی 10,000 خروجی. بدون پردازش تصویر.


اگر سرویس های بیشتری را میخواهید این ریپازتوری را نگاه کنید:

Free LLM API resources