Digio enfrastrikti

AI modèl & GPU

Kouri ajan yo sou modèl fwontyè jere jodi a—oswa lwe kapasite GPU, deplwaye pwa pwòp ou yo, epi dirije travay Digio nan pwen final prive nan menm espas travay la.

Tradui literalman: Claude, GPT, Gemini Pou chak ajan chwazi modèl GPU lokasyon & BYOM
Modèl jere

Modèl ki disponib nan Digio jodi a

Bay yon modèl default pou chak ajan oswa pase pou chak travay. Itilizasyon yo mezire nan Digio Tokens nan balans plan ou a—menm bous la si ajan an rele Sonnet, GPT-4o, oswa Gemini Flash.

Antwopik Claude

  • Claude Opus 4.7 Rezònman flagship, kontèks long, achitekti ak travay estrateji.
  • Claude Opus 4.6 Opus jenerasyon anvan an pou analiz ki estab ak kalite siperyè.
  • Claude Sonnet 4.6 Chofè chak jou—kodaj, ekri, ak plizyè etap ajan bouk.
  • Claude Sonnet 4.5 / 4 Nivo Sonnet rapid ak kach rapid sou chaj travay sipòte.
  • Claude Haiku 4.5 Proje latansi ki ba, klasifikasyon, ak gwo volim sou-travay.

Tradui literalman: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Dènye fanmi GPT-5 pou chaj travay jeneral ak ajan.
  • GPT-4.1 & GPT-4o Chat multimodal serye ak itilizasyon zouti pou ajan pwodiksyon yo.
  • GPT-4o mini Kout-efikas pou rezime ak etap ki lejè.
  • o3 / o3-pro / o3-mini / o4-mini Modèl ki konsantre sou rezònman pou matematik, planifikasyon, ak verifikasyon.
  • GPT-5.3 Codex & Codex mini Jenerasyon kòd, refactors, ak konpetans ajan repo-konsyan.

Tradui literalman: Google Gemini

  • Gemini 2.5 Pro Long-kontèks rechèch ak ekstraksyon estriktire.
  • Gemini 2.5 Flash Etap ajan wo-debi ak pousantaj siy konpetitif.
  • Gemini 2.0 Flash Pas ultra-rapid pou analiz, tagging, ak travay pakèt.

Louvri & espesyalis APIs

  • DeepSeek Chat & Reasoner Bonjan valè pou chat ak travay style chèn-of-panse.
  • Mistral Large Opsyon Ewopeyen an òganize pou ekip ajan plizyè lang.
  • Llama 3.3 70B Modèl klas louvri-pwa atravè API-pè yo byen ak GPU prive.
  • Grok 3 Modèl oryante an tan reyèl pou nouvèl ak ajan siveyans sosyal.
  • Sonar Pro Repons ki baze sou rechèch pou ajan rechèch yo.
  • Command R+ RAG-zanmitay antrepriz chat ak workflows rekipere.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Itilizasyon

Ki jan ajan yo chwazi yon modèl

Koòdonatè a ka rekòmande Sonnet vs Opus vs yon modèl flash pi bon mache ki baze sou kalite travay. Itilizatè pouvwa yo mete defo pou chak wòl ajan-rechèch sou Sonnet, revizyon final sou Opus, tagging esansyèl sou Haiku oswa Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU lokasyon

Lwe GPU epi kouri pwòp modèl ou yo

Bezwen yon amann-melodi, yon pòs lè-gapped, oswa pri enferans previzib? Ajoute kapasite GPU dedye nan espas travay Digio ou a, enstale pile pòsyon ou pito a, epi montre ajan yo nan pwen final prive ou a.

Enstans dedye

Nœuds GPU chak èdtan oswa chak mwa (klas A100, H100, L40S) ki tache ak lokatè w la—izolasyon ak lòt kliyan.

Pwa ou yo

Telechaje safetensors, GGUF, oswa rale soti nan rejis ou a; kouri Llama, Mistral, Qwen, ak koutim amann-melodi.

Sèvi estanda

vLLM, TGI, Ollama, oswa imaj veso ou kenbe—ajan Digio yo rele yon URL baz ki konpatib OpenAI.

Menm orchestrasyon

Pou fè, ekip chat, ladrès, ak kolaborasyon san okenn chanjman-se sèlman backend la enferans ki pou ou.

Ibrid routage

Voye etap sansib nan GPU prive epi sèvi ak Claude oswa GPT pou rechèch piblik nan yon sèl workflow.

Kontwòl antrepriz

Peering VPC, sòti estatik, mòso odit, ak lis modèl pou ekip reglemante.

Pote pwòp modèl ou

Enstale epi konekte yon modèl koutim

Konfigirasyon tipik soti nan zewo jiska ajan k ap rele pwen final ou a:

  1. Rezève GPU

    Chwazi VRAM, rejyon, ak disponiblite (pete vs toujou sou). Depo pou pwa bato ak egzanp lan oswa monte bokit ou.

  2. Deplwaye pil la

    Kòmanse yon imaj k ap sèvi oswa SSH nan, enstale chofè CUDA, epi chaje pòs yo. Chèk sante konfime modèl la pare.

  3. Anrejistre pwen final

    Ajoute URL de baz, kle API, ak id modèl nan anviwònman espas travay. Digio valide fòma latansi ak siy anvan li ale viv.

  4. Bay ajan yo

    Chwazi modèl prive ou kòm default pou ajan chwazi yo; modèl Claude/GPT jere yo rete disponib kòt a kòt.

Lwaye GPU yo voye bòdwo separe de abònman plan Digio. Kontakte nou pou planifikasyon kapasite, SLA, ak migrasyon soti nan yon gwoup enferans ki egziste deja.

B2B SaaS sit entènèt UI etikèt. Tradui an ht natirèl: FAQ

Modèl ak kesyon GPU

Chwazi API jere vs enferans pwòp tèt ou-akomode sou Digio.

Èske mwen peye de fwa-plan plis API?

Abònman Digio ou a kouvri enfrastrikti, ajan, e enkli Digio Tokens. Jere debi itilizasyon modèl ki balans siy pa siy aktyèl opinyon / pwodiksyon. Lwe GPU se yon adisyon pou machin ou kontwole yo.

Èske diferan ajan yo ka itilize modèl diferan?

Wi—chak ajan ka gen pwòp default li yo. Travay ak chat yo ka depase pou yon sèl kouri san yo pa chanje default global la.

Ki diferans ki genyen ant Sonnet ak Opus?

Opus se branche pou rezònman pi difisil ak pi long plan aderan; Sonnet se pi vit ak pi bon mache pou bouk ajan chak jou. Haiku ak modèl flash-klas yo pi bon pou sou-tach volim.

Èske mwen ka kouri modèl pwòp mwen sèlman epi bloke API nwaj yo?

Espas travay antrepriz yo ka mete restriksyon sou founisè modèl sortan yo epi mennen tout trafik ajan nan pwen final GPU ou. Mòd ibrid se default pou pifò ekip yo.

Ki gwosè GPU ki disponib?

Ofri yo depann de rejyon ak demann—souvan nivo 24–80 GB VRAM pou modèl klas 7B–70B ak nœuds milti-GPU pou pi gwo pil. Nou ede gwosè VRAM soti nan konte paramèt ou ak quantization.

Èske itilizasyon prive GPU toujou konsome Digio Tokens?

Òkestrasyon (ajan, travay, depo) rete sou plan ou. Enferans sou GPU ou a faktire kòm tan GPU; ou ka si ou vle mezire itilizasyon siy ki gen fòm pou chaj entèn yo.

Chwazi modèl jere oswa pote GPU ou

Kòmanse sou Claude ak GPT jodi a, apresa ajoute GPU dedye lè w pare pou òganize pwa koutim—menm ajan, menm travay, dediksyon ou.