AI-инструменты 7 апреля 2026 · 6 мин чтения

Как запустить нейросет Gemma 4 на телефоне — без интернета и облака

Google молча выкатила приложение, где Gemma 4 — нейросет уровня флагманов — работает прямо на вашем телефоне. Без серверов, без утечек данных, без подписок. Разбираем, что это такое, как установить на Android и iOS, и какие есть ограничения.

Что произошло

2 апреля 2026 года Google DeepMind выпустила Gemma 4 — семейство открытых языковых моделей под лицензией Apache 2.0. Это значит: бесплатно, с открытым доступом к весам, без привязки к облаку.

Вместе с моделями Google выкатила приложение Google AI Edge Gallery, которое доступно на Android и iOS. Через него можно скачать любую модель Gemma 4 и запустить её полностью локально, без подключения к интернету.

Что важно:

Модель работает без интернета — в самолёте, в метро, где угодно
Данные не покидают устройство — никаких серверов Google
Инференс полностью бесплатный после скачивания модели
Поддерживает текст, изображения и аудио
Открытая лицензия — можно использовать в коммерческих проектах
Агентные навыки — модели умеют планировать действия и работать с внешними инструментами

Линейка моделей Gemma 4: какую выбрать

Google выпустила четыре размера, но для телефонов актуальны два меньших:

Модель	Тип	Где работает	Для чего
Gemma E2B	Effective 2B	Телефон	Быстрый чат, тексты, простые задачи
Gemma E4B	Effective 4B	Телефон (от ~8GB RAM)	Сложные рассуждения, анализ изображений
Gemma 26B MoE	Mixture of Experts, 4B активных	Ноутбук (16GB+ RAM)	Кодинг, мульти-агентные задачи
Gemma 31B	Dense	Ноутбук/ПК (32GB+ RAM)	Максимальное качество, фронт-уровень

Буква «E» означает «Effective» — эффективное количество параметров. Это MoE-модели (Mixture of Experts), которые активируют только часть весов при каждом запросе. Результат — качество модели с большим числом параметров при существенно меньших требованиях к памяти.

Как установить Gemma 4 на Android

Скачайте Google AI Edge Gallery — приложение доступно в Google Play Store либо как APK с GitHub
Откройте и разрешите доступ к хранилищу — приложению нужны права для загрузки моделей
Выберите режим — «AI Chat» для общения, «Agent Skills» для мульти-шаговых сценариев
Скачайте модель — выберите Gemma E2B (быстро, ~1.5 GB) или Gemma E4B (качественнее, ~3–4 GB)
Готово — пишите запросы, модель обрабатывает их полностью на устройстве

Требования к Android-телефону

Модель	Минимум RAM	Размер файла	Рекомендуемые устройства
E2B	6 GB	1.5 GB	Большинство Android от 2021+
E4B	8 GB	3–4 GB	Pixel 7+, Samsung S23+
26B MoE	16 GB	~10 GB	Ноутбук, не телефон
31B Dense	32 GB	~20 GB	Мощный ПК, не телефон

Телефоны с выделенным NPU (Qualcomm Snapdragon 8 Gen 2+ или Google Tensor) работают заметно быстрее — инференс идёт на нейропроцессоре, а не на CPU.

Установка через APK (если нет в Play Store)

Если приложение ещё не доступно в вашем регионе, установите как APK:

Зайдите в Настройки → Приложения → Специальный доступ → Установка неизвестных приложений
Разрешите браузеру (Chrome/Firefox) устанавливать приложения
Откройте GitHub релизы Google AI Edge Gallery
Скачайте последний .apk файл и установите

Как запустить Gemma 4 на iPhone (iOS)

Для iPhone приложение Google AI Edge Gallery доступно в App Store. Логика та же: скачали → выбрали модель → работаете офлайн.

Альтернативы для продвинутых пользователей:

Ollama — запустить Gemma 4 на Macbook (Apple Silicon), iPhone подключится по локальной сети
MLC Chat — отдельное приложение для локального запуска LLM на iOS

Можно ли запустить Gemma 4 на ноутбуке

Да, и это даёт существенно больше возможностей. Три варианта:

Ollama — один командой

ollama run gemma4

Ollama автоматически скачает модель и запустит локальный API. На Apple Silicon работает из коробки с Metal-ускорением. Gemma 4 в Ollama впервые получила полноценную поддержку системного промпта и нативного мультимодального режима.

Google AI Edge Gallery + LiteRT-LM

Google также выпустил LiteRT-LM — SDK для разработчиков, которые хотят встроить Gemma 4 в свои мобильные приложения. Под капотом используется LiteRT (ранее TensorFlow Lite) и MediaPipe для оптимизации инференса на GPU/NPU.

Агентные навыки: что умеет Gemma 4 кроме чата

Это не просто «поговорить с чат-ботом». Google специально позиционирует Gemma 4 как модель для мульти-агентных рабочих потоков. Функция «Agent Skills» в Google AI Edge Gallery показывает несколько сценариев:

Запрос к Википедии — модель получает доступ к внешним данным прямо на устройстве, и отвечает на энциклопедические вопросы с актуальной информацией
Создание флешкарточек и графиков — можно описать данные голосом, а модель построит визуализацию или конспект для изучения
Генерация музыки по фото — подберите музыку, которая совпадает по настроению с вашей фотографией
Мульти-шаговые приложения — через диалог попросите Gemma 4 создать работающее приложение (например, плеер с голосами животных)

«Gemma 4 переопределяет то, что возможно на вашем собственном оборудовании. Теперь это не просто чат-бот, а платформа для агентов и автономных сценариев.» — Google DeepMind Blog, 2 апреля 2026

Gemma 4 на телефоне vs облачные модели: честное сравнение

Не всё так однозначно, давайте разберём объективно:

Параметр	Gemma E4B (на телефоне)	Облачные LLM (ChatGPT, Claude и др.)
Приватность	✅ Данные не покидают устройство	⚡ Запросы идут на сервер
Бесплатно	✅ Навсегда, после скачивания	❌ Подписка или по токенам
Работает без интернета	✅ Полностью офлайн	❌ Только с подключением
Скорость	⚡ Зависит от телефона (3–15 сек)	⚡ Обычно 5–20 сек
Качество кода	⚡ Неплохо для простых задач	✅ Значительно выше на сложных
Контекст	⚡ ~8K токенов	✅ 128K+ токенов
Языки	✅ >140 языков	✅ 100+

Когда Gemma 4 на телефоне — лучший выбор

Нет интернета или слабый сигнал
Чувствительные данные, которые нельзя отправлять в облако
Нужен быстрый ответ без задержек на сеть
Не хочется платить за API или подписку
Путешествие, командировка, отдалённые локации

Когда лучше остаться на облаке

Сложная разработка — нужен большой контекст и продвинутый кодинг
Длинные документы для обработки (контекст на телефоне ограничен)
Нужны последние обновления — на телефоне модель заморожена в версии, которую скачали

Почему это важно

До Gemma 4 «локальный AI на телефоне» был либо демо-игрушкой с крошечными моделями, либо тяжёлой настройкой через командную строку. Google сделал три вещи:

Выпустил модели фронт-качества в размерах, которые влезают в телефон (Effective 2B / 4B)
Сделал приложение с установкой в пару кликов — не нужно знать Linux или Python
Добавил агентные навыки прямо в локальный режим — модель не просто болтает, а работает с инструментами и внешними данными

Если вы ещё не работали с локальными нейросетями — рекомендую начать именно с этого. Скачайте Claude Code для серьёзного кодинга, а Gemma 4 установите на телефон как карманный AI-помощник, работающий всегда и везде. Подробнее о MCP-серверах и подключении AI к другим сервисам читайте в нашем блоге.

Настраиваем AI-агентов и автоматизацию под ваш бизнес

Локальный AI, облачный AI, мульти-агентные системы — разбираем всё. Пишите — обсудим задачу.

→ Написать в Telegram