Если у вас магазин с каталогом на украинском, русском, польском, немецком — стандартные search-решения (включая популярные US SaaS — Klevu, Searchanise) часто проявляют меньшее качество на не-английских языках. Причина: эти модели тренировались преимущественно на англоязычных e-commerce данных. Разбираемся почему и как multilingual-e5-large решает это из коробки.

Проблема: почему US-trained модели проваливаются

Большинство smart-search SaaS-платформ создавались для US-рынка: Shopify-магазины с англоязычными каталогами, fashion/electronics/beauty домены. Когда эти продукты "expand to international markets" — добавляют basic-translations, но core-модель остаётся англо-trained.

📊
На нашем бенчмарке (UA-магазин 30k SKU посуды): Klevu давал ~88% top-3 на украинском, ~92% на английском. Searchanise — 78% UA, 89% EN. AI Search — 92.7% UA, 91% EN. Multilingual-first модели дают стабильное качество на всех языках.

Стандартный LIKE OpenCart и его пределы

OpenCart использует SQL LIKE '%query%'. На UA/RU/PL проваливается на 5 уровнях:

1. Морфология

Пример морфологии

Чашка → Чашки, Чашке, Чашку, Чашкой, Чашек, Чашкам...

2. Латиница/кириллица

"stiklokeramika" или "стеклокерамика" — стандартный поиск не поймёт.

3. Синонимы

"холодильник" / "фридж", "тарелка" / "блюдо".

4. Транслитерация

"Айфон" / "iPhone", "Панасоник" / "Panasonic".

5. Cross-language

Покупатель с украинским UI вводит "сковорода" — товар проиндексирован только украинским "пательня" — поиск падает.

Models compared

МодельТренировочные данныеUA/RU/PL качество
OpenAI ada-002~93% Englishпосредственно
KlevuUS e-commerceпосредственно
SearchaniseUS/UK e-commerceограничено
BGE-M3multilingualхорошо
multilingual-e5-large100+ языков параллельноотлично

multilingual-e5-large-instruct — open-source модель от Microsoft Research. Тренирована на 100+ языках параллельно (не "английский + переводы"). Морфология / cross-language / синонимы / транслитерация — всё работает.

Cross-language matching на практике

ЗапросUIНайденный товарЯзык товара
steklokeramikaENСтеклокерамическая тарелкаRU
сковородаRUПательня з антипригарним покриттямUA
kettleENЧайник электрический 1.7лRU
iPhneUAiPhone 15 Pro MaxUA
фріжUAХолодильник SamsungUA

Реальные примеры

Магазин посуды (~30k SKU, isklad.com.ua)

  • Запрос "чашка с блюдцем" — находит "Чашка кофейная с блюдцем 250мл"
  • Запрос "тарелка для пасты" — находит "Глубокая тарелка 23см"
  • Запрос "белый керамический горшок" — находит "Кашпо керамическое белое"

Магазин одежды (5k SKU)

  • Запрос "рубашка с длинным рукавом" — находит блузы + casual shirts
  • Запрос "trousers black" (EN) — находит "Штаны чёрные классические" (RU/UA каталог)
  • Запрос "плаття літне" (опечатка) — находит "Платье летнее"

Статистика

+30%
больше успешных поисков
-26 п.п.
bounce с search-страниц
+15%
conversion (mobile)
-90%
"я не нашёл" в чате

Данные с 5 OpenCart-магазинов, перешедших с LIKE на AI Search в 2025-2026. Детали в «Кейс isklad.com.ua».

Как включить multilingual

В AI Search multilingual — по умолчанию. Не нужно ничего отдельно настраивать:

  1. Установить модуль (5 минут — инструкция)
  2. Reindex — модуль автоматически проиндексирует товары на всех активных языках
  3. Готово — поиск работает multilingually из коробки
🌍
Важно: в Klevu/Searchanise/Doofinder multilingual часто требует Pro+ тарифа или add-on. В AI Search — включено в каждый тариф. Free-план с 200 SKU тоже получает все языки.

FAQ

Сколько языков поддерживает AI Search?

100+ через multilingual-e5-large. Лучше всего: UA, RU, PL, DE, ES, IT, FR, EN. Для китайского/корейского/японского эффективность чуть ниже, но работает.

А если каталог только английский?

Multilingual-модель не хуже US-моделей на английском. Бенчмарк: 91-93% top-3 на EN-каталогах vs ~94% Klevu.

Нужно ли отдельно проиндексировать каждый язык?

Нет. AI Search автоматически проиндексирует все активные языки магазина при reindex.

Что если у части товаров нет перевода?

Fallback работает. Товар проиндексирован только в UA — найдётся через cross-language matching multilingual-модели.

Можно ли отключить cross-language matching?

Да. AI Search → Settings → Strict Language Mode: Enabled.

Влияет ли multilingual на скорость?

Нет. Размер вектор-пространства не зависит от количества языков. Скорость остаётся ~200ms на 30k SKU независимо от локалей.