Phi-3-vision: a nova ferramenta da Microsoft para analisar imagens

Microsoft lança Phi-3-vision, um modelo de IA compacto que analisa imagens e é ideal para dispositivos móveis O post Phi-3-vision: a nova ferramenta da Microsoft para analisar imagens apareceu primeiro em Olhar Digital.

Phi-3-vision: a nova ferramenta da Microsoft para analisar imagens




A Microsoft lançou o Phi-3-vision, uma nova versão de seu modelo de linguagem pequeno, Phi-3, projetado para interpretar e analisar imagens. Este modelo, parte da série Phi-3, pode realizar tarefas de raciocínio visual, como responder a perguntas sobre imagens e gráficos, e seu tamanho reduzido o torna altamente adequado para dispositivos móveis.









Principais recursos do Phi-3-vision

  • O Phi-3-vision é um modelo multimodal, o que significa que pode processar tanto texto quanto imagens.
  • Ele possui 4,2 bilhões de parâmetros, indicando sua complexidade e a profundidade de seu treinamento.
  • Apesar de suas capacidades, o Phi-3-vision é significativamente menor do que outros modelos de IA focados em imagens, como o DALL-E da OpenAI ou o Stable Diffusion da Stability AI.
  • Diferentemente desses modelos, que geram imagens, o Phi-3-vision se destaca em entender e analisar imagens existentes.

Leia mais:

O Phi-3-vision está atualmente disponível para visualização prévia, enquanto os outros modelos da família Phi-3 — Phi-3-mini, Phi-3-small e Phi-3-medium — podem ser acessados através da biblioteca de modelos do Azure.

*Nota em atualização.

O post Phi-3-vision: a nova ferramenta da Microsoft para analisar imagens apareceu primeiro em Olhar Digital.