📑 В этой статье
Если у вас магазин с каталогом на украинском, русском, польском, немецком — стандартные search-решения (включая популярные US SaaS — Klevu, Searchanise) часто проявляют меньшее качество на не-английских языках. Причина: эти модели тренировались преимущественно на англоязычных e-commerce данных. Разбираемся почему и как multilingual-e5-large решает это из коробки.
Проблема: почему US-trained модели проваливаются
Большинство smart-search SaaS-платформ создавались для US-рынка: Shopify-магазины с англоязычными каталогами, fashion/electronics/beauty домены. Когда эти продукты "expand to international markets" — добавляют basic-translations, но core-модель остаётся англо-trained.
Стандартный LIKE OpenCart и его пределы
OpenCart использует SQL LIKE '%query%'. На UA/RU/PL проваливается на 5 уровнях:
1. Морфология
Пример морфологии
Чашка → Чашки, Чашке, Чашку, Чашкой, Чашек, Чашкам...
2. Латиница/кириллица
"stiklokeramika" или "стеклокерамика" — стандартный поиск не поймёт.
3. Синонимы
"холодильник" / "фридж", "тарелка" / "блюдо".
4. Транслитерация
"Айфон" / "iPhone", "Панасоник" / "Panasonic".
5. Cross-language
Покупатель с украинским UI вводит "сковорода" — товар проиндексирован только украинским "пательня" — поиск падает.
Models compared
| Модель | Тренировочные данные | UA/RU/PL качество |
|---|---|---|
| OpenAI ada-002 | ~93% English | посредственно |
| Klevu | US e-commerce | посредственно |
| Searchanise | US/UK e-commerce | ограничено |
| BGE-M3 | multilingual | хорошо |
| multilingual-e5-large | 100+ языков параллельно | отлично |
multilingual-e5-large-instruct — open-source модель от Microsoft Research. Тренирована на 100+ языках параллельно (не "английский + переводы"). Морфология / cross-language / синонимы / транслитерация — всё работает.
Cross-language matching на практике
| Запрос | UI | Найденный товар | Язык товара |
|---|---|---|---|
| steklokeramika | EN | Стеклокерамическая тарелка | RU |
| сковорода | RU | Пательня з антипригарним покриттям | UA |
| kettle | EN | Чайник электрический 1.7л | RU |
| iPhne | UA | iPhone 15 Pro Max | UA |
| фріж | UA | Холодильник Samsung | UA |
Реальные примеры
Магазин посуды (~30k SKU, isklad.com.ua)
- Запрос "чашка с блюдцем" — находит "Чашка кофейная с блюдцем 250мл"
- Запрос "тарелка для пасты" — находит "Глубокая тарелка 23см"
- Запрос "белый керамический горшок" — находит "Кашпо керамическое белое"
Магазин одежды (5k SKU)
- Запрос "рубашка с длинным рукавом" — находит блузы + casual shirts
- Запрос "trousers black" (EN) — находит "Штаны чёрные классические" (RU/UA каталог)
- Запрос "плаття літне" (опечатка) — находит "Платье летнее"
Статистика
Данные с 5 OpenCart-магазинов, перешедших с LIKE на AI Search в 2025-2026. Детали в «Кейс isklad.com.ua».
Как включить multilingual
В AI Search multilingual — по умолчанию. Не нужно ничего отдельно настраивать:
- Установить модуль (5 минут — инструкция)
- Reindex — модуль автоматически проиндексирует товары на всех активных языках
- Готово — поиск работает multilingually из коробки
FAQ
Сколько языков поддерживает AI Search?
100+ через multilingual-e5-large. Лучше всего: UA, RU, PL, DE, ES, IT, FR, EN. Для китайского/корейского/японского эффективность чуть ниже, но работает.
А если каталог только английский?
Multilingual-модель не хуже US-моделей на английском. Бенчмарк: 91-93% top-3 на EN-каталогах vs ~94% Klevu.
Нужно ли отдельно проиндексировать каждый язык?
Нет. AI Search автоматически проиндексирует все активные языки магазина при reindex.
Что если у части товаров нет перевода?
Fallback работает. Товар проиндексирован только в UA — найдётся через cross-language matching multilingual-модели.
Можно ли отключить cross-language matching?
Да. AI Search → Settings → Strict Language Mode: Enabled.
Влияет ли multilingual на скорость?
Нет. Размер вектор-пространства не зависит от количества языков. Скорость остаётся ~200ms на 30k SKU независимо от локалей.