تو این یادداشت چند تا API رایگان معرفی کردم که میتونید باهاشون به مدلهای زبان بزرگ (LLM) دسترسی داشته باشید و بدون هزینه از هوش مصنوعی استفاده کنید. برای تست یا پروژه های شخصی کاملا جواب میدن. اما ممکنه برای استفاده های سنگین مناسب نباشه و لازم باشه اشتراک تهیه کنید.
OpenRouter

- DeepSeek
- Llama
- Mistral
- Qwen
- OpenAI
محدودیت: ۲۰ درخواست در دقیقه، ۵۰ درخواست در روز.
Google AI Studio

- Gemini (2.5 Pro, 2.5 Flash, Flash-Lite…)
- Gemma
- and embedding.
محدودیت: بین ۵ تا ۳۰ درخواست در دقیقه و ۵۰ تا ۲۵۰ درخواست در روز (بسته به مدل).
Cohere

- Command-A, Command-R, Command-R+
- Aya Expanse, Aya Vision
- and embedding
محدودیت: ۲۰ درخواست در دقیقه، ۱۰۰۰ درخواست در ماه. (توضیحات کامل)
Cerebras

- Llama3
- Llama4
- qwen-3
- gpt oss (120b)
فقط از همین مدل های اپن سورس پشتیبانی می کند. اما چون روی سرورهای قوی اجرا می شود سرعت خوبی دارد.
محدودیت: تقریباً همهی مدلها سقف ۳۰ درخواست در دقیقه، ۹۰۰ در ساعت و ۱۴,۴۰۰ در روز دارند. محدودیت توکن هم برای بیشتر مدلها حدود ۶۰ تا ۶۴ هزار توکن در دقیقه و ۱ میلیون در ساعت و روز است.
Groq

- Meta: Llama 3, Llama 4
- OpenAI :gpt-oss
- whisper (تبدیل گفتار به متن)
محدودیت: از ۱۰۰۰ تا ۱۴۴۰۰ درخواست در روز بسته به مدل، محدودیت توکن بین ۶هزار تا ۷۰هزار در دقیقه.
Liara

مدلها:
- GPT-4o-mini
- Gemini 2.0 Flash
محدودیت: ۱ درخواست در ثانیه، حداکثر توکن روزانه: 100,000 ورودی 10,000 خروجی. بدون پردازش تصویر.
اگر سرویس های بیشتری را میخواهید این ریپازتوری را نگاه کنید: