چینچیلا ایآی
ظاهر
چینچیلا ایآی (به انگلیسی: Chinchilla AI) یک خانواده از مدلهای زبانی بزرگ است که توسط تیم تحقیقاتی دیپمایند توسعه یافته و در مارس ۲۰۲۲ ارائه شدهاست.[۱] این مدل «چینچیلا» نامگذاری شده زیرا از خانواده مدل قبلی خود به نام «گوفر» پیشرفت بیشتری داشتهاست. هر دو مدل به منظور بررسی قوانین مقیاسبندی مدلهای زبان بزرگ آموزش دیدند.[۲]
منابع
[ویرایش]- مشارکتکنندگان ویکیپدیا. «Chinchilla AI». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۲۳ ژوئن ۲۰۲۳.
- ↑ Hoffmann, Jordan; Borgeaud, Sebastian; Mensch, Arthur; Buchatskaya, Elena; Cai, Trevor; Rutherford, Eliza; Casas, Diego de Las; Hendricks, Lisa Anne; Welbl, Johannes; Clark, Aidan; Hennigan, Tom; Noland, Eric; Millican, Katie; Driessche, George van den; Damoc, Bogdan (2022-03-29). "Training Compute-Optimal Large Language Models". arXiv:2203.15556 [cs.CL].
- ↑ Rae, Jack W.; Borgeaud, Sebastian; Cai, Trevor; Millican, Katie; Hoffmann, Jordan; Song, Francis; Aslanides, John; Henderson, Sarah; Ring, Roman; Young, Susannah; Rutherford, Eliza; Hennigan, Tom; Menick, Jacob; Cassirer, Albin; Powell, Richard (2022-01-21). "Scaling Language Models: Methods, Analysis & Insights from Training Gopher". arXiv:2112.11446 [cs.CL].