Как мы создавали новый LLM-переводчик Яндекса Хабр

Abel Cummings

Mar 26, 2025 • 3 min read

Мы провели серию тестов с этими двумя моделями, анализ которых представлен в таблице ниже. Точность результатов мы оценивали в процентах совпадения текстов с тестовыми примерами обучения. блог Дополнительные трудности, однако несмотря на это возможно повысить качество работы модели на очень большую величину. В случае наличия достаточно большого количества данных для обучения, можно начать с предварительно обученных весов, и при их помощи обучать всю имеющуюся сеть. Обученная на этом блоке данных модель сохраняется в «предобученные» веса (блок 4 на рисунке 1).

GPT 3

Первая проблема — гладкость и связность перевода, иначе именуемая как fluency. Так как датасеты для SFT собраны с помощью различных эвристик и пайплайнов матчинга, https://ai.google/discover качество самих текстов не очень высокое. Обучая модели на таких текстах, мы никогда не получим модель, свободную от таких ошибок.

На чём учатся современные модели машинного перевода: опыт команды Яндекс Переводчика

Компания ожидает регулярных обновлений серии Claude, а Claude 3 станет важнейшим шагом на пути к созданию искусственного интеллекта общего назначения, отражая сознательный подход к ответственному использованию потенциала ИИ.
В то же время, GPT-3, являясь самой крупной на данный момент нейросетью, имеет 175 млрд параметров.
Определение основных параметров является важным шагом в процессе создания 3D моделей.
Параметр температуры способствует увеличению как разнообразия в пределах ответа, так и разнообразия между ответами, в то время как штрафы за частоту/присутствие повышают только разнообразие в пределах ответа.

Исторически в машинном переводе применялись автоматические метрики — BLEU, ROUGE, METEOR. Они стали плохо работать несколько лет назад, потому что качество моделей стало достаточно высоким и стало видно, что exact-match-метрики поощряют буквальные переводы без перефразировок. Помимо fluency repair, мы используем и классическую процедуру сбора данных для alignment — сравнение различных переводов с помощью асессоров-переводчиков. А что, если использовать general-purpose LLM как перефразировщик, а базовую модель перевода — как генератор начальных гипотез? Некоторые параметры могут быть оптимизированы в зависимости от того, будут ли они использоваться для визуализации, анимации, инженерных расчетов или других целей. Экспериментируйте с различными настройками и применяйте лучшие практики, чтобы получить максимальное качество в своих 3D моделях. 3D моделирование позволяет создавать реалистические и высококачественные модели различных объектов, будь то архитектура, предметы интерьера, персонажи игр и многое другое. Однако, чтобы достичь максимального качества, необходимо правильно настроить параметры моделей. В этом разделе мы рассмотрим основные настройки, которые позволят вам создавать великолепные 3D модели. Одним из первых параметров, который нужно определить, является масштаб модели. При этом, поскольку каждый раз исключается лишь один из небольших блоков, тестируемая модель обучается на большем объеме данных и получается ближе к итоговой, которую мы обучаем на всей выборке. Коэффициент обучения определяет скорость обновления параметров модели во время обучения. Слишком высокий коэффициент может привести к нестабильности модели, а слишком низкий может замедлить процесс обучения. Кроме того, Harness поддерживает различные виды бэкендов LLM (например, VLLM, GGUF и так далее). Это обеспечивает высокую степень гибкости настройки в изменении промтов и экспериментах с ними. Language Model Evaluation Harness — это унифицированный фреймворк для бенчмаркинга LLM на большом количестве задач оценки. Я намеренно выделил слово «задач», потому что в сценариях Harness НЕТ такой концепции. В большинстве случаев, описанных ниже, можно заметить, что сценарий часто состоит из множества датасетов бенчмарков. Выбор количества тем - это сложный вопрос, который требует баланса между детализацией и обобщением. Слишком маленькое количество тем может не уловить разнообразие тематик в данных, а слишком большое количество тем может привести к нежелательному размытию результатов. Важно экспериментировать с разными значениями и оценивать, насколько хорошо модель адаптируется к вашим данным и задачам. Правильно подобранные материалы могут придать модели реалистичность и глубину. Также важно учесть, что различные объекты и поверхности требуют разных типов материалов и текстур. Учтите особенности материалов, из которых состоит объект, и настройте текстуру с учетом их свойств, таких как цвет, фактура и отражательная способность. Так как наша работа посвящена модели генерации текста, рассматривать подходы для обучения мы будем на примере текстов. В современном мире постоянно развивающихся информационных технологий и работы с искусственным интеллектом роль модели генерации связного текста постоянно растет. Настоящая статья продолжает серию из трех статей, посвященных анализу работы моделей генерации текста, созданных для взаимодействий вида «человек-машина». Благодаря обучению на больших наборах данных и использованию глубоких свёрточных архитектур, CNN достигают высокой точности в задачах классификации и детекции объектов. Основным принципом работы свёрточных нейронных сетей является использование свёрточных слоев, которые выполняют операции свёртки с изображением и обучаются выделять различные признаки на разных уровнях абстракции. Далее следуют слои пулинга, которые уменьшают размерность изображения, сохраняя важные признаки.

GPT 3

На чём учатся современные модели машинного перевода: опыт команды Яндекс Переводчика

Sign up for more like this.