API رایگان هوش مصنوعی (LLM)

تو این یادداشت چند تا API رایگان معرفی کردم که می‌تونید باهاشون به مدل‌های زبان بزرگ (LLM) دسترسی داشته باشید و بدون هزینه از هوش مصنوعی استفاده کنید. برای تست یا پروژه های شخصی کاملا جواب میدن. اما ممکنه برای استفاده های سنگین مناسب نباشه و لازم باشه اشتراک تهیه کنید.

OpenRouter

مدل‌ها: مجموعه بزرگی از مدل‌ها از پلتفرم‌های مختلف مثل:

DeepSeek
Llama
Mistral
Qwen
Google
OpenAI

محدودیت: ۲۰ درخواست در دقیقه، ۵۰ درخواست در روز.

Google AI Studio

مدل‌ها: سری

Gemini (2.5 Pro, 2.5 Flash, Flash-Lite…)
Gemma
and embedding.

محدودیت: بین ۵ تا ۳۰ درخواست در دقیقه و ۵۰ تا ۲۵۰ درخواست در روز (بسته به مدل).

Cohere

کوهر مدل‌های امبدینگ خوبی داره و برای RAG بسیار مناسبه.

مدل‌ها:

Command-A, Command-R, Command-R+
Aya Expanse, Aya Vision
and embedding

محدودیت: ۲۰ درخواست در دقیقه، ۱۰۰۰ درخواست در ماه. (توضیحات کامل)

Cerebras

مدل‌ها:

Llama3
Llama4
qwen-3
gpt oss (120b)

فقط از همین مدل‌های اپن‌سورس پشتیبانی می‌کنه اما چون روی سرورهای قوی اجرا می شه سرعت خیلی خوبی داره.

محدودیت: تقریباً همه‌ی مدل‌ها سقف ۳۰ درخواست در دقیقه، ۹۰۰ در ساعت و ۱۴,۴۰۰ در روز دارند. محدودیت توکن هم برای بیشتر مدل‌ها حدود ۶۰ تا ۶۴ هزار توکن در دقیقه و ۱ میلیون در ساعت و روز هست.

Groq

مدل‌ها:

Meta: Llama 3, Llama 4
OpenAI :gpt-oss
whisper (تبدیل گفتار به متن)

محدودیت: از ۱۰۰۰ تا ۱۴۴۰۰ درخواست در روز بسته به مدل، محدودیت توکن بین ۶هزار تا ۷۰هزار در دقیقه.

Liara (موقتا غیر فعال شده)

Red0

لیارا پلن رایگان هوش مصنوعی داشت که به خاطر کمبود ظرفیت موقتا غیرفعال شده.

مدل‌ها:

GPT-4o-mini
Gemini 2.0 Flash

محدودیت: ۱ درخواست در ثانیه، حداکثر توکن روزانه: 100,000 ورودی 10,000 خروجی. بدون پردازش تصویر.

اگر سرویس های بیشتری را میخواهید این ریپازتوری را نگاه کنید:

Free LLM API resources

فهرست

حسین فردمحمدی

API رایگان هوش مصنوعی (LLM)

فهرست

OpenRouter

Google AI Studio

Cohere

Cerebras

Groq

Liara (موقتا غیر فعال شده)

بک‌لینک‌ها

نمای گراف