تو این یادداشت چند تا API رایگان معرفی کردم که میتونید باهاشون به مدلهای زبان بزرگ (LLM) دسترسی داشته باشید و بدون هزینه از هوش مصنوعی استفاده کنید. برای تست یا پروژه های شخصی کاملا جواب میدن. اما ممکنه برای استفاده های سنگین مناسب نباشه و لازم باشه اشتراک تهیه کنید.
OpenRouter

- DeepSeek
- Llama
- Mistral
- Qwen
- OpenAI
محدودیت: ۲۰ درخواست در دقیقه، ۵۰ درخواست در روز.
Google AI Studio

- Gemini (2.5 Pro, 2.5 Flash, Flash-Lite…)
- Gemma
- and embedding.
محدودیت: بین ۵ تا ۳۰ درخواست در دقیقه و ۵۰ تا ۲۵۰ درخواست در روز (بسته به مدل).
Cohere
کوهر مدلهای امبدینگ خوبی داره و برای RAG بسیار مناسبه.

- Command-A, Command-R, Command-R+
- Aya Expanse, Aya Vision
- and embedding
محدودیت: ۲۰ درخواست در دقیقه، ۱۰۰۰ درخواست در ماه. (توضیحات کامل)
Cerebras

- Llama3
- Llama4
- qwen-3
- gpt oss (120b)
فقط از همین مدلهای اپنسورس پشتیبانی میکنه اما چون روی سرورهای قوی اجرا می شه سرعت خیلی خوبی داره.
محدودیت: تقریباً همهی مدلها سقف ۳۰ درخواست در دقیقه، ۹۰۰ در ساعت و ۱۴,۴۰۰ در روز دارند. محدودیت توکن هم برای بیشتر مدلها حدود ۶۰ تا ۶۴ هزار توکن در دقیقه و ۱ میلیون در ساعت و روز هست.
Groq

- Meta: Llama 3, Llama 4
- OpenAI :gpt-oss
- whisper (تبدیل گفتار به متن)
محدودیت: از ۱۰۰۰ تا ۱۴۴۰۰ درخواست در روز بسته به مدل، محدودیت توکن بین ۶هزار تا ۷۰هزار در دقیقه.
Liara (موقتا غیر فعال شده)
Red0
لیارا پلن رایگان هوش مصنوعی داشت که به خاطر کمبود ظرفیت موقتا غیرفعال شده.

مدلها:
- GPT-4o-mini
- Gemini 2.0 Flash
محدودیت: ۱ درخواست در ثانیه، حداکثر توکن روزانه: 100,000 ورودی 10,000 خروجی. بدون پردازش تصویر.
اگر سرویس های بیشتری را میخواهید این ریپازتوری را نگاه کنید: