Како функционише вештачка интелигенција (AI)?

Вештачка интелигенција може деловати као магични трик који сви климају главом док тихо размишљају... чекајте, како ово заправо функционише? Добре вести. Демистификоваћемо то без превише детаља, остати практични и убацити неколико несавршених аналогија које и даље чине да кликне на ствар. Ако само желите суштину, пређите на једноминутни одговор испод; али искрено, детаљи су оно што вас тера да схватите 💡.

Чланци које бисте можда желели да прочитате након овог:

🔗 Шта значи скраћеница GPT
Кратко објашњење акронима GPT и његовог значења.

🔗 Одакле вештачка интелигенција добија своје информације
Извори које вештачка интелигенција користи за учење, обуку и одговарање на питања.

🔗 Како укључити вештачку интелигенцију у своје пословање
Практични кораци, алати и токови рада за ефикасну интеграцију вештачке интелигенције.

🔗 Како покренути компанију за вештачку интелигенцију
Од идеје до лансирања: валидација, финансирање, тим и реализација.

Како функционише вештачка интелигенција? Одговор за један минут ⏱️

Вештачка интелигенција учи обрасце из података како би правила предвиђања или генерисала садржај - нису потребна рукописна правила. Систем прикупља примере, мери колико је погрешан путем функције губитка и подешава своје унутрашње дугмад - параметре - да буду мало мање погрешни сваки пут. Исперите, поновите, побољшајте. Са довољно циклуса, постаје корисно. Иста прича без обзира да ли класификујете имејлове, уочавате туморе, играте друштвене игре или пишете хаику. За једноставну основу „машинског учења“, IBM-ов преглед је солидан [1].

Већина модерне вештачке интелигенције је машинско учење. Једноставна верзија: унос података, учење мапирања од улаза до излаза, а затим генерализација на нове ствари. Не магична математика, рачунарство и, ако смо искрени, мало уметности.

„Како функционише вештачка интелигенција?“ ✅

Када људи гуглају „Како функционише вештачка интелигенција?“ , обично желе:

ментални модел за вишекратну употребу коме могу веровати
мапа главних типова учења како би жаргон престао да буде застрашујући
завирите у неуронске мреже без да се изгубите
Зашто трансформатори изгледа да сада владају светом
практични пут од података до имплементације
брза табела за поређење коју можете направити на екрану и сачувати
заштитне ограде о етици, пристрасности и поузданости које нису неодговорне

То је оно што ћете овде добити. Ако лутам, то је намерно - као да идем живописном рутом и некако се следећи пут боље сетим улица. 🗺️

Основни састојци већине вештачке интелигенције 🧪

Замислите систем вештачке интелигенције као кухињу. Четири састојка се појављују изнова и изнова:

Подаци — примери са или без ознака.
Модел — математичка функција са подесивим параметрима.
Циљ — функција губитка која мери колико су лоше претпоставке.
Оптимизација — алгоритам који подешава параметре како би смањио губитак.

У дубоком учењу, тај подстицај је обично градијентни спуст са повратним ширењем звука - ефикасан начин да се схвати које дугме на огромној звучној плочи је шкрипало, а затим га мало смањи [2].

Мини-случај: Заменили смо крхки филтер за спам заснован на правилима малим надгледаним моделом. Након недељу дана петљи означи → мерење → ажурирање, лажно позитивни резултати су смањени, а број захтева за подршку је смањен. Ништа посебно - само јаснији циљеви (прецизност код „хамских“ имејлова) и боља оптимизација.

Парадигме учења на први поглед 🎓

Надгледано учење.
Обезбеђујете парове улаза и излаза (фотографије са ознакама, имејлови означени као спам/нису спам). Модел учи улаз → излаз. Окосница многих практичних система [1].
Ненадзирано учење.
Без ознака. Пронађите структурне кластере, компресије, латентне факторе. Одлично за истраживање или претходну обуку.
Самонадгледано учење
Модел креира сопствене ознаке (предвиђа следећу реч, недостајући део слике). Претвара сирове податке у сигнал за обуку у великим размерама; подупире модерне језичке и визуелне моделе.
Учење појачањем
Агент делује, прикупља награде и учи политику која максимизира кумулативну награду. Ако вам „функције вредности“, „политике“ и „учење временских разлика“ звуче познато - ово је њихов дом [5].

Да, категорије се замагљују у пракси. Хибридне методе су нормалне. Стварни живот је неуредан; добар инжењеринг се сусреће са тим где јесте.

Унутар неуронске мреже без главобоље 🧠

Неуронска мрежа слаже слојеве ситних математичких јединица (неурона). Сваки слој трансформише улазе помоћу тежина, пристрасности и меке нелинеарности попут ReLU или GELU. Ранији слојеви уче једноставне функције; дубљи кодирају апстракције. „Магија“ - ако је можемо тако назвати - је композиција : повежите мале функције и можете моделирати изузетно сложене феномене.

Петља тренинга, само вибрације:

претпоставка → грешка мерења → окривљавање атрибута путем повратне подршке → тежине померања → понављање.

Урадите ово у више серија и, попут неспретног плесача који побољшава сваку песму, модел престаје да вам гази прсте. За пријатељско, ригорозно поглавље о backprop-у, погледајте [2].

Зашто су трансформатори преузели примат - и шта заправо значи „пажња“ 🧲

Трансформери користе самопажњу да би одмерили који делови уноса су важни једни другима, све одједном. Уместо да чита реченицу строго слева надесно као старији модели, трансформер може да гледа свуда и динамички процењује односе - попут скенирања препуне просторије да би видео ко коме говори.

Овај дизајн је избацио рекурентност и конволуције за моделирање секвенци, омогућавајући масивни паралелизам и одлично скалирање. Рад који је започео - Пажња је све што вам је потребно - излаже архитектуру и резултате [3].

Самопосматрање у једном реду: направите упита , кључа и вредности за сваки токен; израчунајте сличности да бисте добили тежине пажње; комбинујте вредности у складу са тим. Сложено у детаљима, елегантно у духу.

Упозорење: Трансформатори доминирају, а не монополишу. CNN, RNN и ансамбли стабала и даље побеђују код одређених типова података и ограничења латенције/трошкова. Изаберите архитектуру за посао, а не захваљујући њој.

Како функционише вештачка интелигенција? Практични процес који ћете заправо користити 🛠️

Уоквиривање проблема
Шта предвиђате или генеришете и како ће се мерити успех?
податке
, означите их ако је потребно, очистите и поделите. Очекујте недостајуће вредности и граничне случајеве.
Моделирање
Почните једноставно. Основне линије (логистичка регресија, градијентно појачавање или мали трансформатор) често побеђују херојску сложеност.
Обука
Изаберите циљ, изаберите оптимизатор, поставите хиперпараметре. Поновите.
Евалуација
Користите резерве, унакрсну валидацију и метрике повезане са вашим стварним циљем (тачност, F1, AUROC, BLEU, збуњеност, латенција).
Имплементација
Служи иза API-ја или уграђено у апликацију. Прати латенцију, трошкове, пропусност.
Праћење и управљање
Пратите померање, праведност, робусност и безбедност. Оквир за управљање ризицима у вези са вештачком интелигенцијом NIST-а (УПРАВЉАЈ, МАПИРАЈ, МЕРИ, УПРАВЉАЈ) је практична контролна листа за поуздане системе од почетка до краја [4].

Мини-случај: Модел вида је одлично прошао лабораторију, а затим је доживео проблем на терену када се осветљење променило. Праћење означеног померања у улазним хистограмима; брзо повећање + фино подешавање појачања је вратило перформансе. Досадно? Да. Ефикасно? Такође да.

Табела поређења - приступи, за кога су намењени, оквирна цена, зашто функционишу 📊

Намерно несавршено: мало неуједначено формулисање помаже да се осећа људски.

Приступ	Идеална публика	Приближно скупо	Зашто функционише / напомене
Надгледано учење	Аналитичари, тимови производа	ниско-средње	Директно мапирање уноса → ознака. Одлично када постоје ознаке; чини окосницу многих распоређених система [1].
Без надзора	Истраживачи података, истраживање и развој	ниско	Проналази кластере/компресије/латентне факторе - добро за откривање и претходну обуку.
Самостално надгледано	Тимови платформе	средњи	Прави сопствене етикете од сирових података-скала помоћу рачунарства и података.
Учење са појачањем	Роботика, истраживање операција	средње-високо	Учи политике из сигнала награђивања; прочитајте Сатона и Бартоа за канон [5].
Трансформерси	НЛП, визија, мултимодални	средње-високо	Самопажња хвата дубине на велике удаљености и добро се паралелизује; видети оригинални рад [3].
Класично машинско учење (дрвеће)	Табеларне пословне апликације	ниско	Јефтине, брзе, често шокантно јаке основне линије на структурираним подацима.
Засновано на правилима/симболично	Усклађеност, детерминистичка	веома ниско	Транспарентна логика; корисна у хибридима када вам је потребна могућност ревизије.
Евалуација и ризик	Сви	варира	Користите NIST-ов GOVERN-MAP-MEASURE-MANAGE да бисте га одржали безбедним и корисним [4].

Цена = обележавање података + рачунарство + људи + услуживање.

Дубински увид 1 - функције губитака, градијенти и ситни кораци који мењају све 📉

Замислите да постављате линију да бисте предвидели цену куће на основу њене величине. Бираш параметре (w) и (b), предвиђаш (\hat{y} = wx + b) и мериш грешку помоћу средњег квадрата губитка. Градијент ти говори у ком правцу да се крећеш (w) и (b) да би најбрже смањио губитак - као ходање низбрдо кроз маглу, осећајући у ком правцу се тло нагиње. Ажурирај након сваке серије и твоя линија се приближава стварности.

У дубоким мрежама то је иста песма са већим опсегом. Backprop ефикасно израчунава како су параметри сваког слоја утицали на коначну грешку, тако да можете померити милионе (или милијарде) дугмади у правом смеру [2].

Кључне интуиције:

Губитак обликује пејзаж.
Градијенти су ваш компас.
Брзина учења је величина корака - превелика је и клатићете се, премала је и дремаћете.
Регуларизација вас спречава да памтите сет за тренинг као папагај са савршеним сећањем, али без разумевања.

Дубински увид 2 - уграђивање, подстицање и претраживање 🧭

Уграђивања мапирају речи, слике или ставке у векторске просторе где се сличне ствари налазе близу једна другој. То вам омогућава:

пронађите семантички сличне одломке
моћна претрага која разуме значење
укључите генерисање проширено претраживањем (RAG) тако да језички модел може да претражи чињенице пре него што их запише

Подстицање је начин на који усмеравате генеративне моделе - опишете задатак, наведете примере, поставите ограничења. Замислите то као писање веома детаљне спецификације за веома брзог практиканта: жељног, повремено превише самоувереног.

Практични савет: ако ваш модел халуцинира, додајте присећање, пооштрите подстицај или процените помоћу утемељених метрика уместо „вибрација“.

Дубински увид 3 - евалуација без илузија 🧪

Добра евалуација делује досадно - што је управо поента.

Користите закључани сет за тестирање.
Изаберите метрику која одражава бол корисника.
Урадите аблације да бисте знали шта је заправо помогло.
Забележите грешке са стварним, неуредним примерима.

У производњи, праћење је евалуација која никада не престаје. Дешава се дрифтовање. Појављује се нови сленг, сензори се рекалибришу, а јучерашњи модел мало помера. NIST оквир је практична референца за текуће управљање ризицима и управљање, а не документ о политици који треба одложити [4].

Напомена о етици, пристрасности и поузданости ⚖️

Системи вештачке интелигенције одражавају своје податке и контекст примене. То доноси ризик: пристрасност, неуједначене грешке међу групама, крхкост при промени дистрибуције. Етичка употреба није опционална - то су улози. NIST указује на конкретне праксе: документовање ризика и утицаја, мерење штетних пристрасности, изградња резервних решења и информисање људи када су улози високи [4].

Конкретни потези који помажу:

прикупљају разноврсне, репрезентативне податке
мерење учинка у свим подпопулацијама
картице модела докумената и листови са подацима
додајте људски надзор тамо где је улог висок
пројектовати безбедносне механизме када је систем неизвестан

Како функционише вештачка интелигенција? Као ментални модел можете поново користити 🧩

Компактна контролна листа коју можете применити на скоро сваки систем вештачке интелигенције:

Шта је циљ? Предвиђање, рангирање, генерисање, контрола?
Одакле долази сигнал за учење? Ознаке, задаци под самонадгледањем, награде?
Која архитектура се користи? Линеарни модел, ансамбл стабла, CNN, RNN, трансформатор [3]?
Како је оптимизовано? Варијације градијентног спуштања/повратни проп [2]?
Који режим података? Мали обележени скуп, океан необележеног текста, симулирано окружење?
Који су начини отказа и мере заштите? Пристрасност, померање, халуцинације, латенција, мапирање трошкова према NIST-овом GOVERN-MAP-MEASURE-MANAGE [4].

Ако можете да одговорите на та питања, у основи разумете систем - остало су детаљи имплементације и знање домена.

Брзи извори вредни обележавања 🔖

Увод у концепте машинског учења (IBM) једноставним језиком [1]
Повратно ширење помоћу дијаграма и једноставне математике [2]
Рад о трансформатору који је променио моделирање секвенци [3]
NIST-ов оквир за управљање ризицима вештачке интелигенције (практично управљање) [4]
Уџбеник о канонском учењу са појачањем (бесплатно) [5]

Честа питања о муњама ⚡

Да ли је вештачка интелигенција само статистика?
То је статистика плус оптимизација, рачунарство, инжењеринг података и дизајн производа. Статистика је скелет; остало је мишић.

Да ли већи модели увек побеђују?
Скалирање помаже, али квалитет података, евалуација и ограничења примене често су важнији. Најмањи модел који постиже ваш циљ је обично најбољи за кориснике и новчанике.

Може ли вештачка интелигенција да разуме?
Дефинишите разумевање . Модели бележе структуру у подацима и импресивно генерализују; али имају слепе тачке и могу бити самоуверено погрешни. Третирајте их као моћне алате, а не као мудраце.

Да ли је ера трансформатора заувек?
Вероватно не заувек. Сада је доминантна јер се пажња добро паралелизује и скалира, као што је показао оригинални рад [3]. Али истраживања се стално настављају.

Како функционише вештачка интелигенција? Предугачко, нисам читао/ла 🧵

Вештачка интелигенција учи обрасце из података, минимизира губитке и генерализује их на нове улазе [1,2].
Надгледано, ненадгледано, самонадгледано и учење са појачањем су главни начини обуке; RL учи из награда [5].
Неуронске мреже користе повратно ширење и градијентни спуст да би ефикасно подесиле милионе параметара [2].
Трансформатори доминирају многим секвенцијалним задацима јер самопажња обухвата односе паралелно на великој скали [3].
Вештачка интелигенција у стварном свету је цевовод - од обликовања проблема, преко примене и управљања - а NIST-ов оквир вас држи искреним у вези са ризиком [4].

Ако неко поново пита „ Како функционише вештачка интелигенција?“ , можете се осмехнути, сркнути кафу и рећи: учи из података, оптимизује губитак и користи архитектуре попут трансформатора или ансамбала стабала у зависности од проблема. Затим додајте намигивање, јер је то и једноставно и подмукло комплетно. 😉

Референце

[1] IBM - Шта је машинско учење?
прочитајте више

[2] Мајкл Нилсен - Како функционише алгоритам Backpropagation,
прочитајте више

[3] Васвани и др. - Пажња је све што вам треба (arXiv)
прочитајте више

[4] NIST - Оквир за управљање ризицима вештачке интелигенције (AI RMF 1.0)
прочитајте више

[5] Сатон и Барто - Учење са поткрепљивањем: Увод (2. издање)
прочитајте више

Пронађите најновију вештачку интелигенцију у званичној продавници вештачке интелигенције

О нама

Назад на блог

Земља/регион