Компанијата денеска конечно откри на што работела тајно сето ова време. Дали возбудата беше оправдана? И да и не, пишува угледниот MiT Technology Review.
Gemini е најголемото лансирање на вештачка интелигенција на Google досега, неговиот обид да ги надмине ривалите OpenAI и Microsoft во трката за превласт со вештачка интелигенција. Несомнено е дека моделот е најдобар во својата класа во широк опсег на можности - „машина за сè“, како што вели еден експерт.
„Овој модел е инхерентно поспособен“, рече Сундар Пичаи, извршен директор на Google и нејзината матична компанија Alphabet, за MIT Technology Review. „Тоа е платформа. ВИ е длабока промена на платформата, поголема од веб или мобилниот. Тоа е голем чекор за нас“.
Тоа е голем чекор за Google, но не мора да значи огромен чекор напред за да полето како целина, според MiT Technology Review. Google DeepMind тврди дека Gemini го надминува GPT-4 во 30 од 32 стандардни мерки за изведба. А сепак, линиите меѓу нив се тенки.
Она што го направи DeepMind е да ги комбинира моменталните способности за вештачка интелигенција во еден моќен пакет. Судејќи според демо-снимките, тој прави многу работи многу добро - но исто така и неколку работи што не сме ги виделе досега. Gemini, според MiT Technology Review, би можеле да бидат знак дека го достигнавме врвот на вештачката интелигенција. Барем засега.
Чираг Шах, професор на Универзитетот во Вашингтон кој е специјализиран за онлајн пребарување, го споредува денешното претставување на Google со откривањето на новиот iPhone секоја година од страна на Apple. „Можеби сега штотуку достигнавме друг праг, каде што ова не нè импресионира толку многу бидејќи сме виделе толку многу неодамна“, вели тој.
Како и GPT-4, Gemini е мултимодален, што значи дека е способен да прифаќа повеќе видови на влез: текст, слика, звук. Тој може да ги комбинира овие различни формати за да одговори на прашања за сè, од домашни работи до математика и економија за на факултет.
Во демо за печатот, Google ја демонстрираше способноста на Gemini да направи скриншот од постоечка табела, да анализира стотици страници истражувања со нови податоци, а потоа да ја ажурира табелата со тие нови информации. Во друг пример, на Gemini им се прикажани слики од омлет кој се готви во тава и се прашуваат (говор, а не текст) дали омлетот е подготвен. „Не е готов бидејќи јајцата се уште се течни“, одговара тој.
Сепак, повеќето луѓе ќе мора да чекаат за целосно искуство. Верзијата лансирана денес е дел од Bard, четботот за пребарување базиран на текст на Google, за кој компанијата вели дека Gemini ќе му даде понапредни способности за размислување, планирање и разбирање. Целосното издание на Gemini ќе биде објавено во текот на следните месеци.
Новиот бард зајакнат со Gemini првично ќе биде достапен на англиски јазик во повеќе од 170 земји, не вклучувајќи ги ЕУ и Британија. Таквата одлука е донесена за Google да може претходно да се консултира со локалните регулатори, според Сиси Хсијао, потпретседател на Google задолжен за Бард.
Gemini доаѓа и во три големини: Ultra, Pro и Nano. Ултра е верзијата со целосна моќност; Pro и Nano се прилагодени на апликации кои работат со поограничени компјутерски ресурси. Nano е дизајниран да работи на уреди како што се новите телефони Pixel на Google.
Програмерите и бизнисите ќе можат да пристапат до Gemini Pro почнувајќи од 13 декември. Gemini Ultra, најмоќниот модел, ќе биде достапен „на почетокот на следната година“ по „обемните проверки на довербата и безбедноста“, изјавија за новинарите директорите на Google.
„Ние гледаме на тоа како на ерата на Gemini на моделот“, рече Пичаи, додавајќи: „Вака Google DeepMind ќе изгради и ќе напредува во областа на вештачката интелигенција. Затоа, таа секогаш ќе претставува граница, место за напредок во технологијата на вештачка интелигенција“.
Најмоќниот модел на OpenAI, GPT-4, се смета за златен стандард на индустријата. Додека Google се фалеше дека Gemini ги надминува претходните GPT 3.5 модел на OpenAI, раководителите на компанијата избегнуваа прашања за тоа колку моделот го надминува GPT-4.