Den canadiske AI-virksomhed Ideogram har præsenteret Ideogram 4.0, en ny ucensureret billedgenereringsmodel målrettet designere, udviklere og virksomheder, der arbejder med kampagner, branding, emballage, sociale medier og andre visuelle produktioner, hvor tekst og layout skal sidde præcist.
Til både realistiske billeder i 2K-opløsning og designproduktion
Hvor mange billedmodeller især konkurrerer på fotorealisme, positionerer Ideogram sin nye model som et værktøj til egentlig designproduktion. Ifølge virksomheden er Ideogram 4.0 bygget til at levere realistiske billeder i 2K-opløsning, håndtere tekst på flere sprog, følge præcise layoutinstruktioner og skabe elementer, der senere kan redigeres.
Åbne vægte og ucensureret
Et centralt punkt i lanceringen er, at Ideogram 4.0 udgives med åbne vægte. Det betyder, at udviklere og organisationer kan downloade modellen, finjustere den og køre den på egen hardware. For virksomheder kan det være særligt interessant, fordi modellen dermed kan tilpasses egne brandmanualer, produktbilleder og kampagnestile — og i nogle tilfælde køres bag virksomhedens egen firewall.
Ideogram fremhæver især modellens evne til at forstå struktur. Modellen er trænet med en proces, hvor billeder først beskrives som strukturerede data med scener, baggrunde, tekstfelter og objekter, hvorefter modellen lærer at genskabe billedet ud fra den struktur. Det skal gøre den bedre til at følge komplekse designbriefs end modeller, der primært reagerer på almindelige tekstprompter.
For designteams er det mest konkrete løfte bedre kontrol. Ideogram 4.0 understøtter blandt andet placering af elementer gennem bounding boxes, farvepaletter og mere præcis gengivelse af tekst. Det er funktioner, der kan være afgørende i alt fra plakater og reklamebannere til produktmockups og emballagedesign, hvor en fejlstavet overskrift eller et forkert placeret logo hurtigt gør et AI-genereret billede ubrugeligt.
Prompt præcision for bedre og mere brugbare resultater
Lanceringen viser også, hvordan konkurrencen på AI-billeder er ved at ændre karakter. I 2023 og 2024 handlede meget af markedet om at skabe smukke eller realistiske billeder fra korte prompts. Med Ideogram 4.0 flyttes fokus i højere grad mod kontrollerbare, produktionsklare designsystemer, hvor billedgenerering kan indgå i automatiserede arbejdsgange.
Ideogram tilbyder samtidig modellen via en hosted API med forskellige kvalitetstrin, så virksomheder kan vælge mellem hastighed, pris og billedkvalitet uden nødvendigvis selv at drive modellen lokalt. Det gør lanceringen relevant både for eksperimenterende udviklere, kreative teams og større organisationer, der vil integrere billedgenerering direkte i produkter eller interne workflows.
Ikke open source - noter omkring licens
Selv om Ideogram omtaler modellen som open-weight, er det ikke det samme som fuldt open source i klassisk forstand. Koden og vægtene er gjort tilgængelige, men kommerciel brug afhænger af licensvilkår. Det kan blive et vigtigt skel for virksomheder, der ønsker at bruge modellen i produktion.
Med Ideogram 4.0 forsøger virksomheden derfor at ramme et hul i markedet: en billedmodel, der kombinerer åben adgang, lokal kørsel og designorienteret præcision. Hvis modellen lever op til løfterne i praktisk brug, kan den blive et attraktivt alternativ til lukkede billedgeneratorer for teams, der har brug for mere kontrol over typografi, layout og brandudtryk.
Ideogram 4.0 kan køres lokalt i miljøer som ComfyUI, hvor den seneste version har Ideogram 4 workflow indbygget som template - eller via deres website - klik her.
Kommentarer (0)
Vær den første til at skrive en kommentar!
Du skal være logget ind for at skrive en kommentar.
Log ind eller opret dig