Новости и события » Hi-Tech » GigaChat обошла GPT 3.5 и Gemini в рейтинге AI Benchmarking Guide 2024

GigaChat обошла GPT 3.5 и Gemini в рейтинге AI Benchmarking Guide 2024

GigaChat обошла GPT 3.5 и Gemini в рейтинге AI Benchmarking Guide 2024

Агентство ChipAI провело исследование AI Benchmarking Guide 2024 с целью выявить 10 лучших больших языковых моделей (LLM). Результаты исследования опубликовал ресурс Arabian Business.

В рамках исследования группа экспертов провела серию слепых тестов: аналитики оценивали результаты работы нейромодели, не зная, какая именно технология стоит за каждым ответом. Для определения итоговой оценки каждой LLM эксперты использовали комбинацию двух факторов: оценку работы модели на ее «родном» языке (чаще всего английском) и на любом другом поддерживаемом языке.

В ходе исследования нейросети решали различные задачи: переводили текст, генеририровали идеи и программный код, анализировали данные. Среди критериев оценки - точность, релевантность, связность и способность работать с уточнениями от пользователя.

Метод тестирования, получившие название side-by-side, обеспечивает «всестороннее и справедливое» сравнение технологий, утверждает ChipAI.

Рейтинг AI Benchmarking Guide 2024 выглядит следующим образом:

  1. GPT-4 (OpenAI);
  2. Claude-3 (Anthropic);
  3. Llama70B (Meta);
  4. GigaChat («Сбер»);
  5. Gemini (Google);
  6. GPT-3.5 (OpenAI);
  7. Claude-3 Sonnet (Anthropic);
  8. Zephyr (Stability AI);
  9. Claude-3 Opus (Anthropic);
  10. Mistral (Mistral AI).

GigaChat от «Сбера» получила наивысшие оценки за работу на русском языке. Нейросети отечественной разработки удалось обойти Gemini от Google и GPT-3.5 от OpenAI.


Свежие новости Украины на сегодня и последние события в мире экономики и политики, культуры и спорта, технологий, здоровья, происшествий, авто и мото

Вверх