Nori oktober: Umetna inteligenca v polnem razcvetu!
Oktober 2024 je bil eden od najplodnejših mesecev zadnjih dveh let na področju UI. Tokratne novosti je nemogoče stisniti v kratek članek, zato bom poudaril zgolj najpomembnejše dogodke in predstavitve v oktobru.
Luka Tišler
Meta: MovieGen
Meta je predstavila svoj prvi video model MovieGen, ki omogoča generiranje krajših videoposnetkov iz tekstovnih opisov. MovieGen obljublja kakovostne videoposnetke brez predhodnega poznavanja snemanja in postprodukcije, kar bo zagotovo prevetrilo ustvarjanje videovsebin. Takšna tehnologija omogoča blagovnim znamkam, da učinkoviteje ustvarjajo promocijske vsebine, pa tudi posameznikom, ki želijo hitro pripraviti kreativne videoposnetke.
Adobe: Nova UI-orodja
Na dogodku MAX 2024 je Adobe predstavil vrsto novih UI-orodij, ki obljubljajo več ustvarjalne svobode. Med njimi so izboljšave pri generaciji slik, urejanju videa in nova orodja za sodelovanje z UI v realnem času, kar bo ustvarjalcem pomagalo hitreje priti do želenih rezultatov. Posebej zanimiva novost je umetno podaljševanje posnetkov v Premiere Pro. Adobe je prav tako razširil funkcionalnosti za sodelovanje v oblaku, kar omogoča povezano delo med ekipami, ne glede na lokacijo.
Claude: Nove funkcionalnosti
Podjetje Anthropic je predstavilo nove funkcionalnosti za svoj jezikovni model Claude. Claude je zdaj na voljo tudi kot namizna aplikacija, kar omogoča hitrejši dostop do naprednih funkcij, kot je analiza podatkov, in podpira dikcijo, kar uporabnikom omogoča enostavnejšo komunikacijo brez tipkanja. Nova funkcija za analizo velikih podatkovnih nizov omogoča hitrejše vpoglede v podatke, kar je pomembno za podjetja v hitrem okolju.
Videonovosti: Mochi, Pyramid Flow, Haiper 2.0, Runway in Tora
Na področju UI-videa sta se pojavila dva nova odprtokodna video modela, Mochi in Pyramid Flow, ki obljubljata izboljšano zmogljivost pri ustvarjanju videovsebin z licenco Apache 2.0, kar pomeni, da jih lahko uporabljamo brezplačno v komercialne namene. Haiper je predstavil prenovljeni model Haiper 2.0, ki obljublja naprednejše animacije. Runway je lansiral Act-One, orodje za nadzor obrazne mimike in govora UI-likov, model Tora pa omogoča podrobno kontrolo premikanja objektov v videu, kar je idealno za ustvarjanje kompleksnih scen.
Slikovni modeli: Stable Diffusion 3.5, Flux 1.1 in Omnigen
Na področju slikovne UI so bili predstavljeni Stable Diffusion 3.5, Flux 1.1 in Omnigen, ki prinašajo izboljšave pri generiranju slik, boljšo natančnost in bogatejše kreativne možnosti. Stable Diffusion 3.5 omogoča hitrejše generiranje visoko kakovostnih slik z večjo pozornostjo na podrobnosti. Flux 1.1 prinaša večjo svobodo pri prilagajanju slogov, Omnigen pa ponuja izboljšane funkcije za mešanje slogov, kar omogoča ustvarjalcem, da združujejo različne umetniške pristope in ustvarjajo edinstvene slike.
Poleg tega sta bili uvedeni še dve ključni orodji – Midjourneyjev novi editor in Ideogram Canvas, ki omogočata dodajanje ali spreminjanje objektov v sliki ter spreminjanje umetniškega sloga. Ideogram Canvas omogoča tudi napredno prilagajanje svetlobe in sence v sliki, kar dodaja več dimenzije končnim izdelkom in odpira nove možnosti za umetniške izraze.
Le vrh ledene gore
Kot nekdo, ki dnevno uporablja ta orodja, moram reči, da smo v izjemnem trenutku, ko kreativnost in tehnologija resnično hodita z roko v roki. Umetna inteligenca postaja vse bolj dostopna in prilagodljiva, kar pomeni nove načine ustvarjanja vsebin, ki bodo preoblikovali svet kreativnosti in komunikacije. Oktobra smo videli resnično impresiven niz novih tehnologij, a to je le vrh ledene gore. Ta članek pokriva le nekaj ključnih poudarkov, novosti pa je bilo še veliko več, kar dokazuje, da je prihodnost kreativnega izražanja z umetno inteligenco svetla in polna potenciala. Priložnosti za inovacije so povsod, le pograbiti jih moramo.