2023 рік, що минає, можна сміливо назвати роком нейронних мереж. Схоже, що всі великі компанії запустили хоча б одну власну нейронну мережу. Для одних він використовується для генерації зображень, а для інших – це текстова модель, за допомогою якої можна побудувати діалог і використовувати його для створення різного контенту. Однак Apple залишилася осторонь цього заходу і нічого не запропонувала користувачам своїх пристроїв. Але не поспішайте засмучуватися. iOS 18 і macOS 15, швидше за все, виправлять це непорозуміння.
Нещодавно компанія опублікувала дослідницьку статтю, де розповідає про створення власної мовної моделі штучного інтелекту під назвою MM1. Як це працює, чи варто очікувати цього в майбутніх оновленнях операційних систем, і чи з’явиться генеративна нейромережа на iPhone.
Нейронна мережа на iPhone
Мовна модель MM1 від Apple в першу чергу спрямована на створення більш просунутих і гнучких систем штучного інтелекту. Для цього компанія використовувала не лише текст для навчання нейромережі, а й зображення. Причому робилося це в різних комбінаціях: тільки картинка, тільки текст, текст + картинка. Завдяки такому підходу вдалося навчити ШІ не лише коментувати те, що зображено на фотографіях, картинах та інших візуальних елементах, а й відповідати на запитання за допомогою графіки. Замість текстової відповіді нейромережа може створити зображення, яке дасть більш точне визначення того, що ви від нього попросили.
Природно, ШІ сам вирішуватиме, коли такий підхід доцільніший. Крім того, ви можете попросити їх використовувати лише текст у будь-який час. Так що обмежень в даному випадку практично немає. Крім того, мовна модель MM1 спрямована на те, щоб опис зображень, які завантажуються в нейромережу Apple, було максимально точним. Штучний інтелект повинен розповідати про все, навіть найменші деталі, які непомітні на перший погляд. Щоб досягти такого ефекту, розробники Apple вивчають велику кількість різних архітектур, що використовуються в інших нейронних мережах, і намагаються взяти з них найкраще. В даний час модель MM1 включає в себе 30 мільярдів параметрів, і можна не сумніватися, що це не межа.
Він має чудові здібності до контекстного навчання, а це означає, що він зможе навчатися під час спілкування з користувачами. Окремо розробники виділяють можливості багатоступінчастого міркування. Досить дати ІІ кілька підказок, і він зможе вибудувати ланцюжок думок, при цьому не забуваючи про контекст. Чудово, що Apple так серйозно ставиться до створення власного ШІ для своїх пристроїв. Однак у світлі останніх новин виникає відчуття, що навіть цих зусиль недостатньо для отримання бажаних результатів.
Безкоштовна нейронна мережа Google Gemini
За словами Марка Гурмана з Bloomberg, Apple веде переговори з Google про те, щоб перенести чат-бота Gemini на iPhone. Інсайдер припускає, що власна розробка компанії з Купертіно недостатньо просунута, щоб зайняти місце на смартфонах компанії. Тому зараз Apple шукає партнерів, які поділяться з нею своїм ШІ. Імовірність того, що домовленість з Google буде досягнута, насправді дуже висока. Поки незрозуміло, на яких умовах це буде зроблено, але можна не сумніватися, що компанії зможуть домовитися на взаємовигідних умовах.
Більше того, вже є приклади таких партнерств. Google роками платить Apple за те, щоб вона була пошуком за замовчуванням на iPhone. Мінг-Чі Куо погоджується з Гурманом. На його думку, немає жодних ознак того, що генеративний ШІ від Apple з’явиться у 2024 році. Розвиток компанії значно відстає від того, що пропонують її конкуренти. І навіть нова мовна модель у цьому не допомагає. Якщо з якихось причин Apple не може домовитися з Google про впровадження Gemini, то розглядається запасний варіант у вигляді використання ChatGPT від OpenAI на iPhone.
Причому Apple потребує такого партнерства рівно до того моменту, поки її власний розвиток не досягне гідного рівня. Ризикну припустити, що сторонній ШІ працюватиме на iPhone принаймні в iOS 18. Насправді, дивно, що Apple не включилася в розробку власної генеративної нейронної мережі трохи раніше. Виникає відчуття, що команда з Купертіно намагається застрибнути в поїзд, що відходить, а тому доводиться залучати партнерів ззовні.
Буде дуже цікаво подивитися, чи стануть Gemini або ChatGPT на iPhone частиною Siri або їх дозволять використовувати окремо. Крім того, до кінця не ясно, чи буде ШІ в iOS 18 працювати російською мовою. Судячи з того, як нові функції з’являлися раніше, спочатку вони будуть доступні лише кількома іноземними мовами та в обмеженій кількості країн.
Також дивіться: Apple випустила iOS 17.4 Release Candidate. Як оновити свій iPhone раніше за всіх і випробувати нові функції