Mistral AI lanserer Mistral 3: Ny generasjon åpne multimodale og flerspråklige AI-modeller

Vis hovedpunkter
  • Mistral AI lanserer Mistral 3, en ny generasjon åpne AI-modeller.
  • Serien inkluderer Mistral Large 3, en avansert modell med 41 milliarder aktive parametere.
  • Ministral 3-serien tilbyr mindre modeller på 3, 8 og 14 milliarder parametere for kantbruk.
  • Modellene har multimodale og flerspråklige evner, og er tilgjengelige under Apache 2.0-lisensen.
  • Samarbeid med NVIDIA, vLLM og Red Hat sikrer effektiv distribusjon og ytelse.
Mistral AI lanserer Mistral 3: Ny generasjon åpne multimodale og flerspråklige AI-modeller
Bilde er generert av KI

Mistral AI har nylig annonsert lanseringen av Mistral 3, en ny generasjon åpne AI-modeller som kombinerer avanserte multimodale og flerspråklige funksjoner. Denne serien inkluderer både store og små modeller, designet for å møte et bredt spekter av behov innen kunstig intelligens.

Mistral Large 3 er flaggskipet i denne serien, en avansert modell med en "Mixture of Experts"-arkitektur som inneholder 41 milliarder aktive parametere og totalt 675 milliarder parametere. Denne modellen er trent på 3000 NVIDIA H200 GPU-er og er blant de mest kapable åpne modellene tilgjengelig i dag. Den støtter både multimodale og flerspråklige funksjoner, noe som gjør den egnet for komplekse oppgaver som dokumentanalyse, koding, innholdsskaping og AI-assistenter.

For brukere med behov for mindre modeller, tilbyr Ministral 3-serien tre størrelser: 3, 8 og 14 milliarder parametere. Disse modellene er tilgjengelige i tre varianter: Base (grunnmodell), Instruct (optimalisert for samtaler og assistentoppgaver) og Reasoning (optimalisert for komplekse logiske og analytiske oppgaver). Alle variantene støtter bildeforståelse og håndterer kontekstvinduer på 128K-256K, noe som gjør dem egnet for bruk på enheter med begrensede ressurser, som bærbare datamaskiner, roboter og andre kant-enheter.

Mistral AI har samarbeidet med NVIDIA, vLLM og Red Hat for å sikre effektiv distribusjon og ytelse av Mistral 3-modellene. Dette samarbeidet har resultert i optimaliserte sjekkpunkter i NVFP4-format, som muliggjør effektiv kjøring av Mistral Large 3 på NVIDIA Blackwell NVL72-systemer og på enkle 8×A100 eller 8×H100 noder ved bruk av vLLM. I tillegg er Ministral-modellene optimalisert for distribusjon på NVIDIA DGX Spark, RTX-PC-er og bærbare datamaskiner, samt Jetson-enheter, noe som gir utviklere en konsistent og høyytelsesplattform fra datasenter til robot.

Alle Mistral 3-modellene er tilgjengelige under Apache 2.0-lisensen, noe som gir utviklere og bedrifter frihet til å tilpasse og distribuere modellene etter egne behov. Denne åpne tilnærmingen understreker Mistral AIs forpliktelse til å gjøre avansert kunstig intelligens tilgjengelig for et bredt spekter av brukere og applikasjoner.

Referanser

Steder

  • Frankrike
  • Paris

Personer

  • Arthur Mensch
  • Guillaume Lample
  • Timothée Lacroix