Není to ani měsíc od chvíle, co se Microsoft vytasil se svými novými armovými laptopy Copilot+, Pohání je umělá inteligence, AI koprocesor a prý budou rychlejší než počítače z Cupertina.
Všichni proto čekali, jak na tuto drzou výzvu zareaguje právě Apple, který celou mánii okolo generativní AI sledoval v posledních dvou letech jakoby zpovzdálí, až to opravdu vypadalo, že mu naprosto ujel vlak a jen nevěřícně zírá na konkurenci.
Po včerejší úvodní keynote výroční konference WWDC už známe odpověď: Když vy budete mít Copilot+, tak my tomu budeme říkat (jak jinak) Apple Intelligence. A protože jsme Apple, který má na rozdíl od vás pod palcem celý ekosystém, uděláme tomu lepší ksicht.
Ale pěkně popořadě.
Něco jako Copilot+, ale s příslibem skvělého UX
Apple Intelligence je v jádru opravdu hodně podobný vizi Copilot+. V praxi to znamená, že přímo na počítači běží lokální malý jazykový model, který rozumí textu, takže jej dokáže analyzovat, sumarizovat a vytvářet. Jazykový model doplňují další nenáročné neuronky, které částečně rozumějí třeba i obrázkům.
Příklad AI práce s textem. Jenny označila text e-mailu a v bublině může změnit jeho tón, opravit chyby, vypsat klíčové body, případně slovně popsat, co s ním má Apple Intelligence vlastně provést
Apple Intelligence se díky tomu všemu postupně učí, kdo je její pán – majitel počítače –, a pomáhá mu v celém spektru operací, protože proniká prakticky do všech dílčích aplikací.
Apple Intelligence usoudila, že tyto informace jsou pro vás hodně důležité a zobrazila je jako prioritní notifikace
V poštovním klientu pomůže napsat lepší mail a v textovém procesoru udělá Bohumila Hrabala i z naprostého idiota. Když budete chtít popřát blízkým, vygeneruje jejich veselou karikaturu, emoji na míru, dohledá všechny fotky z alb, no a ve spojení se Siri zvládne řešit základní jednoduché úkoly, jak to známe z ostatních AI chatbotů.
Aplikace Image Playground umí generovat avatary
Na displeji iPhonu pak zobrazí notifikace, o kterých si myslí, že je potřebujete vidět právě teď. Kéž by to uměl telefon kdysi před lety, když jsem zapomněl zaplatit v termínu daň z nemovitosti.
Až letos na podzim a pouze v angličtině
Toto všechno nám Apple alespoň slíbil v ukázkách na WWDC, jak to ale bude fungovat v praxi, se širší komunita dozví nejdříve až letos na podzim na iOS 18, iPadOS 18 a macOS Sequoia a pouze v angličtině a v anglické lokalizaci systému.
Apple Intelligence bude zároveň k dispozici jen na nejvýkonnějších iPhonech počínaje generací 15 Pro/Pro Max a iPadech a Macích postavených přinejmenším na platformě M1.
S češtinou zatím raději ani nepočítejte
Některé pokročilejší funkce pak dorazí dokonce až příští rok a to samé platí i o podpoře dalších národních jazyků.
Z toho lze usuzovat, že čeština se svými zhruba 13 miliony mluvčích bude na pořadu dne kdo ví kdy (a jestli vůbec), Apple totiž během dlouhých dvanácti let nepřeložil ani svoji asistentku Siri.
Malý jazykový model podobný Phi-3 Silica
Leckoho by napadlo, že nástup velkých modelů s kvalitou GPT-4 definitivně vyřeší věčné problémy s jazykovými bariérami, problém ale spočívá v tom, že k jejich běhu potřebujete superpočítač a permanentní internetové připojení.
Jak byl testovací vzorek lidí spokojený s výstupy malého modelu od Applu a Microsoftu při práci s e-maily a notifikacemi. Phi-3 Mini je obdoba specializované verze Phi-3 Silica pro AI akcelerátory v armových počítačích Copilot+
Apple Intelligence proto pro většinu základních operací používá stejně jako Copilot+ od Microsoftu vlastní malý jazykový model, který už bez problému utáhne přímo platforma A17 Pro a její AI koprocesor na nejvýkonnějších iPhonech.
Složitost naučených AI modelů uvádíme v tzv. parametrech a ten malý od Applu jich čítá zhruba 3 miliardy. Jen pro představu, konkurenční Copilot+ pohání malý model Phi-3 Silica taktéž s 3 miliardami parametrů, ovšem komplexnost velkých modelů (ChatGPT aspol.) se počítá na desítky, stovky a tisíce miliard parametrů!
30 tokenů za sekundu
Malý jazykový model za vás proto sice nenapíše věrohodnou diplomku, ale i se zlomkem intelektu dokáže analyzovat a opravit e-mail, což jsou operace, které budete na iPhonu provádět mnohem častěji a tento výkon na to bohatě stačí.
A bude to docela rychlé, malý model totiž na referenčním iPhonu 15 Pro dokáže zareagovat během 0,6 milisekund a poté generuje odpověď rychlostí 30 tokenů za sekundu (token odpovídá zhruba jedné slabice – jednomu až několika málo znaků).
Private Cloud Compute a velké jazykové modely
Apple Intelligence je nicméně hybridní systém. I když většinu každodenních operací zvládne AI přímo na křemíku mobilu, tabletu a počítače, některé náročnější úkoly bude s vaším svolením provádět v cloudu na velkém jazykovém modelu.
Přenášení soukromých dat kamsi na server k analýze by mohl být pro leckoho fakt velký problém, Apple proto na WWDC představil nový systém Private Cloud Compute, který má zajistit maximální zabezpečení blízké end-to-end šifrování.
Malý model (on-device) a velký model (server) od Applu a srovnání s ostatními podle spokojenosti v odpovědi na vzorku uživatelů
V praxi to znamená, že se data silně zašifrují a odešlou do výpočetní jednotky, které Apple říká Private Cloud Compute Node. V ní už čeká velký jazykový model, který spočítá úlohu, vyplivne výsledek a ten se opět šifrovaně přesune zpět.
Podstatné je to, že po této transakci nesmí na serveru zůstat žádná uživatelská data a během AI analýzy se k informacím nedostanou ani inženýři Applu.
Srovnání malého i velkého modelu s konkurencí v sumarizaci a tvorbě textu
Technicky prý nemůže nastat situace, aby se kdosi v Cupertinu koukal do logu a mezi vousy brblal: „Á, pan Omáčka z Humpolce chce dnes už potřetí vypočítat trojčlenku. To je případ!“
A když nebude stačit ani to, dej tam ChatGPT
Ať už bude kvalita malého a velkého jazykového modelu od Applu jakákoliv, tón poslední dva roky udává chtě nechtě OpenAI, takže na to musela přistoupit i korporace s okousaným jablíčkem v logu.
Na recept na pětichodové menu je Apple Intelligence zjevně krátká, a tak Siri nabídne, že to nechá zpracovat ChatGPT
Apple Intelligence a s ním úzce propojená asistentka Siri proto umožní delegovat chytrost zdarma na ChatGPT (GPT-4o). Pokud systém usoudí, že na váš úkol nebude stačit, prostě se zeptá, jestli ho může vyřešit pomocí neuronek od OpenAI – ať už se bude jednat o práci s textem, nebo analýzu obrázků.
ChatGPT jako další zdroj chytrosti bude k dispozici i v dalších AI úlohách napříč operačním systémem. V tomto případě vygeneruje pohádku před spaním pro jakousi fiktivní Aničku
Apple a OpenAI slibují, že se nemusejí budoucí uživatelé ani v tomto případě obávat toho, že by po nich na serverech OpenAI (tedy Microsoftu) zůstala jakákoliv stopa, zároveň ale budou moci do systému napojit svůj stávající paušál.
Podpora ChatGPT Plus
Takže pokud si už dnes předplácíte ChatGPT Plus s pokročilejší AI, budete ji mít po spárování k dispozici i v Apple Intelligence. To by nakonec mohla být jedna z cest, jak do hry teoreticky zapojit i další národní jazyky včetně češtiny a při zachování jednotného uživatelského rozhraní.
Generování obrázků pomocí DALL-E 3 v ChatGPT Plus
Na podobné úvahy je ale zatím brzy. Apple Intelligence je totiž stejně jako Copilot+ na úplném začátku cesty a v obou případech jsme zatím viděli pouze líbivá dema, co všechno by to mělo umět.
Jak to bude nakonec opravdu rychlé, inteligentní a prakticky využitelné totiž ukáže až závěr roku, kdy se na Apple Intelligence vrhne po vývojářích také širší komunita milionů majitelů nejvýkonnějších iPhonů, iPadů a Maců.