Retrospectiva anului 2023 în AI

2023 a fost anul în care inteligența artificială a continuat să-și extindă influența asupra diverselor domenii ale vieții noastre și s-a dovedit a fi o perioadă captivantă și plină de inovații. Într-un peisaj dinamic, am asistat la o explozie de evenimente semnificative și progrese tehnologice remarcabile, cu impact în sectoare precum tehnologie, artă AI, chatbot-uri și multe altele. Acest material se dorește o retrospectivă cât se poate de detaliată a marilor evenimente dar care rămâne subiectivă, dată fiind bogăția de evenimente care au definit anul 2023 în domeniul inteligenței artificiale.

Luna ianuarie a fost marcată de o investiție impresionantă de 10 miliarde de dolari a Microsoft în OpenAI, care a consolidat colaborarea strategică dintre cele două companii. Îmbunătățiri semnificative în tehnologia text-to-speech au fost evidențiate odată cu lansarea versiunii beta a lui 11 Labs, furnizând o experiență audio mult mai naturală. În domeniul artei AI a fost lansat instruct-pix2pix, sub forma unei platform deschise cu ajutorul căreia utilizatorii pot edita imagini de foarte bună calitate cu ajutorul AI care au depășit evident rezultatele similare de până atunci obținute cu DALL-E, Stable Diffusion sau MidJourney.

Evenimentele din februarie au adus în prim-plan competiția intensificată dintre Google și Microsoft în domeniul chatbot-urilor, cu Bard și Bing Chat intrând pe scena conversațiilor AI. O răsfrângere remarcabilă a capacităților AI în arta digitală a fost Control Nets, o tehnologie care a permis personalizarea pozelor generate de AI, marcând o etapă semnificativă în evoluția acestui domeniu.

Martie a fost o lună plină de anunțuri, inclusiv lansarea așteptată a lui GPT-4, cu capacitatea sa de a genera cod JavaScript din schițe desenate manual, subliniind avansurile spectaculoase ale acestei noi versiuni.

Aprilie a fost martorul unor inovații importante în segmentarea imaginilor și videoclipurilor, prin introducerea Segment Anything de la Meta, iar Wonder Dynamics a adus un impuls semnificativ în posibilitatea înlocuirii personajelor umane reale cu cele generate de AI în producțiile video. În aceeași perioadă, au apărut chatbot-uri autonome, cum ar fi Baby AGI și Auto GPT, cu potențialul lor încă în curs de explorare.

Luna mai a fost marcată de prezența notabilă a personalităților de seamă din comunitatea AI, cum ar fi Jeffrey Hinton- considerat părintele AI, care și-a anunțat plecarea de la Google exprimând preocupările cu privire la riscurile asociate inteligenței artificiale. În contrast, Google și-a anunțat ambițiile de a integra AI într-o varietate de produse și servicii, subliniind impactul tot mai crescut asupra societății. Audiția din Senat al lui Sam Altman, Gary Marcus și alții, a adus în prim-plan apelul la reglementarea AI pentru a gestiona impactul extins al acestei tehnologii. De menționat lansările Shape-E al Open AI care este un generator text- imagine 3D, precum și noile funcțiuni AI grefate în Adobe Photoshop care permit ajustarea imaginilor prin comandă de tip text.

Iunie a adus cu sine lansarea Apple Vision Pro, adăugând funcționalități AI la portofoliul tehnologic al gigantului din Cupertino. Runway Gen 2 a oferit o modalitate îmbunătățită de generare a videoclipurilor bazată pe prompt-uri text sau imagini.

În iulie, uneltele de rezumatizare AI au câștigat popularitate, iar Anthropics a introdus Claude 2 oferind o fereastră de context extinsă și captivantă pentru utilizatori. Claude 2 dezvoltat de Anthropics aduce un chatbot AI avansat care este capabil să interpreteze o cantitate imensă de informații scrise de tip text, ceea ce îl face o resursă chiar mai puternică decât ChatGPT care este destul de limitat la documente lungi. Tot în această perioadă, Llama 2, rezultat al colaborării dintre Microsoft și Meta, a fost lansat ca o resursă gratuită pentru cercetare și uz comercial, consolidând trendul modelelor de limbaj open-source. Generative Fill în Photoshop, adus de Adobe, a reprezentat o contribuție semnificativă pentru modificarea imaginilor prin simpla tastare a prompt-urilor text.

August poate fi menționat doar pentru lansarea Vary Region a celor de la midJourney, care este un editor de imagine înrolat în platformă.

Septembrie a adus o nouă actualizare ChatGPT prin care interacțiunea cu modelul se poate face și verbal prin interogare și răspuns, precum și prin interpretarea imaginilor.

În octombrie, DALL-E 3 a devenit un punct de referință în generarea de imagini AI, oferind răspunsuri fidele la comenzi complexe, iar Adobe Illustrator a introdus Text to Vector, permițând transformarea imaginilor în vectori scalabili în mod eficient.

Noiembrie a adus Grock, un model AI instruit pe date de pe Twitter, conform anunțului lui Elon Musk, și dezvăluirea lui GPT-5 în cadrul OpenAI Dev Day, cu asistenți personalizați antrenați în ChatGPT. Progrese semnificative au fost înregistrate în editarea video cu Motion Brush, modele de consistență latentă și unelte precum Realtime Canvas de la Leonardo și tehnologia Korea.ai.

În decembrie, anul s-a încheiat cu anunțul lui Gemini în cadrul Google Bard și lansarea Mixtral of Experts, o nouă abordare în modelele mari de limbaj, deschizând calea către eficiență sporită în răspunsurile oferite.

Prin aceste evenimente, 2023 a fost un an deosebit de prolific în avansuri tehnologice și inovații în domeniul inteligenței artificiale, anticipând cu entuziasm o continuare a progreselor rapide în anul următor.

(https://www.youtube.com/watch?v=I_m54jvnmgE&list=WL&index=6 canalul Matt Wolfe- EVERYTHING That Happened In AI In 2023)