O que é a OpenAI?
A OpenAI é uma organização de pesquisa que tem como objetivo criar sistemas de inteligência artificial (IA) capazes de realizar uma ampla gama de tarefas em diferentes domínios. A empresa foi fundada por Elon Musk, Sam Altman e outros em 2015 e está sediada em São Francisco.
A OpenAI realiza pesquisas de IA com a intenção declarada de promover e desenvolver uma IA amigável. Os sistemas da OpenAI são executados no quinto supercomputador mais potente do mundo.
Modelos OpenAI
Uma das principais maneiras pelas quais a OpenAI demonstra seus recursos de IA é por meio de seus modelos, que são programas capazes de processar vários tipos de entradas (como texto, imagens, áudio etc.) e produzir saídas (como texto, imagens, áudio etc.) com base em alguma lógica ou regras.
A OpenAI desenvolveu e lançou vários modelos ao longo dos anos, cada um com diferentes recursos e aplicativos. Nesta postagem do blog, exploraremos quantos modelos da OpenAI estão disponíveis, o que eles podem fazer e como você pode acessá-los.
Abaixo estão osAlguns dos 17 modelos mais importantes da OpenAI disponíveis atualmente:
GPT-4
A GPT 4 é tO modelo mais recente e avançado da OpenAI, que pode compreender e gerar linguagem natural ou código, além de aceitar entradas de imagens e emitir saídas de texto.
O GPT-4 é um modelo multimodal de grande porte que apresenta desempenho de nível humano em vários parâmetros profissionais e acadêmicos, como passar em um exame simulado da ordem dos advogados ou resolver problemas de matemática.
No momento, o GPT-4 está em uma versão beta limitada e só pode ser acessado por aqueles a quem foi concedido acesso.
O GPT-4 tem quatro variantes:
Experimente o UberCreate para gerar artigos e códigos usando os modelos mais recentes do OpenAI GPT 4
GPT-4o
O GPT-4o é atualmente o modelo mais avançado da OpenAI. O GPT-4o ("o" de "omni") é multimodal, aceitando entradas de texto e imagem e gerando saídas de texto. Ele tem a mesma alta inteligência do GPT-4 Turbo, mas é mais eficiente, gerando texto duas vezes mais rápido e a um custo 50% menor.
Além disso, o GPT-4o tem um bom desempenho em idiomas que não sejam o inglês e possui excelentes recursos de visão. O modelo GPT-4o já está disponível no UberCreate.
GPT-4 Turbo
Esses são os modelos anteriores de alta inteligência. Eles também aceitam entradas de texto e imagem e produzem saídas de texto. O GPT-4 Turbo é mais rápido e mais econômico do que o GPT-4
GPT-4
O modelo básico gpt-4 tem um comprimento de contexto de 8.192 tokens e é atualizado com a última iteração do modelo.
GPT-4-0314
O modelo gpt-4-0314 é um instantâneo do gpt-4 de 14 de março de 2023 e só terá suporte por um período de três meses, terminando em 14 de junho de 2023.
GPT-4-32k
O modelo gpt-4-32k tem os mesmos recursos que o modelo gpt-4 básico, mas com quatro vezes o comprimento do contexto (32.768 tokens).
GPT-4-32k-0314
O modelo gpt-4-32k-0314 é um instantâneo do gpt-4-32k de 14 de março de 2023 e também só terá suporte por um período de três meses, terminando em 14 de junho de 2023.
GPT-3.5
Um conjunto de modelos que podem entender e gerar linguagem natural ou código, com desempenho e custo-benefício aprimorados em comparação com o GPT-3. O modelo mais capaz dessa família é o gpt-3.5-turbo, que foi otimizado para bate-papo, mas também funciona bem para tarefas de conclusão tradicionais.
O GPT-3.5 tem cinco variantes:
GPT-3.5-turbo
O modelo básico gpt-3.5-turbo é otimizado para bate-papo, mas também funciona bem para tarefas de conclusão tradicionais. Ele tem um comprimento de contexto de 2.048 tokens e é atualizado com a última iteração do modelo.
Os outros quatro modelos são versões ajustadas do gpt-3.5-turbo para domínios específicos.
GPT-3.5-turbo-codex
O Codex é baseado no GPT-3 e ajustado em um grande corpus de código-fonte de várias linguagens de programação. É um sistema que pode gerar e executar códigos a partir de comandos de linguagem natural. Ele também pode responder a perguntas sobre código, explicar trechos de código, corrigir bugs e sugerir melhorias.
Codex para geração e compreensão de códigos. O Codex pode ser usado para tarefas como a criação de sites, aplicativos, jogos ou scripts.
O Codex foi lançado em agosto de 2021 e tem 12 bilhões de parâmetros.
GPT-3.5-turbo-davinci
O Davinci destina-se à compreensão e geração de linguagem natural. O Davinci é baseado em uma rede neural profunda que pode processar grandes quantidades de dados de linguagem natural e gerar textos coerentes e diversificados sobre vários tópicos e domínios. O Davinci também pode responder a perguntas, resumir textos, escrever ensaios, criar histórias e realizar muitas outras tarefas de linguagem natural. O Davinci é um dos modelos de IA mais avançados e versáteis disponíveis atualmente
GPT-3.5-turbo-curie
Curie para resumo de texto e resposta a perguntas. Ele pode gerar textos de alta qualidade para várias tarefas, como resumo, resposta a perguntas, tradução e muito mais. O Curie é baseado na arquitetura GPT-3, mas foi ajustado em um grande corpus de textos da Web para melhorar seu desempenho e precisão. O Curie também pode lidar com vários domínios e idiomas, o que o torna uma ferramenta versátil e flexível para a geração de linguagem natural.
GPT-3.5-turbo-babbage
Babbage para classificação de texto e análise de sentimentos. A Babbage pode receber dados como tabelas, quadros, gráficos ou planilhas e produzir descrições concisas e precisas dos principais insights ou tendências. O Babbage foi projetado para ajudar analistas de dados, pesquisadores, jornalistas e qualquer pessoa que trabalhe com dados a comunicar suas descobertas de forma mais eficaz e eficiente.
DALL-E
O DALL-E é um modelo generativo que pode criar imagens a partir de descrições de texto. Ele também pode manipular imagens existentes com base em entradas de texto. O DALL-E é uma combinação de GPT-3 e um autoencoder variacional (VAE), que é um tipo de rede neural que pode aprender a comprimir e reconstruir dados. O DALL-E foi lançado em janeiro de 2021 e tem 12 bilhões de parâmetros.
Trata-se de um modelo que pode gerar e editar imagens a partir de uma solicitação de linguagem natural, como "dois gatos se beijando em frente à Torre Eiffel em uma pintura" ou "uma pintura de uma paisagem no estilo de Van Gogh". O DALL-E também pode combinar vários conceitos ou atributos em uma única imagem, como "um caracol feito de harpa" ou "uma girafa usando óculos e gravata borboleta".
Tente usar o UberCreate Gerador de imagens de IA para transformar qualquer texto em uma imagem sofisticada. Você tem a opção de selecionar variedades de Estilos de arte como abstrato, realista, renderização 3D, arte digital etc. em vários formatos Meios de imagem como Acrílico, Carvão, Tela, Óleo Clássico etc. e em estados de espírito específicos como Feliz, Alegre, Irritado, Calmo etc.
As opções são ilimitadas com o UberCreate, tudo o que você precisa é de criatividade!!!
TTS (conversão de texto em fala)
Um conjunto de modelos que convertem texto em áudio falado com som natural.
Abaixo estão os dados neurais e padrão Texto para fala da OpenAI vozes que você pode usar no UberCreate.
Nomes de voz | Feminino (Neural) | Masculino (Neural) | Vozes neurais Total | Feminino (padrão) | Macho (padrão) | Vozes padrão Total | Total geral |
Liga metálica | 55 | 55 | 54 | 54 | 109 | ||
Echo | 55 | 55 | 55 | 55 | 110 | ||
Fábula | 55 | 55 | 55 | 55 | 110 | ||
Nova | 55 | 55 | 55 | 55 | 110 | ||
Ônix | 54 | 54 | 55 | 55 | 109 | ||
Cintilante | 55 | 55 | 55 | 55 | 110 | ||
Total geral | 110 | 219 | 329 | 110 | 219 | 329 | 658 |
Embeddings
O modelo OpenAI Embeddings é uma forma de representar a linguagem natural em um formato numérico que pode ser usado por modelos de aprendizado de máquina. Os embeddings capturam o significado e o contexto de palavras e frases e permitem que os modelos executem tarefas como classificação de texto, análise de sentimentos, resposta a perguntas e muito mais.
Sussurro
Um modelo que pode converter áudio em texto, como transcrição de fala ou música. O Whisper também pode executar tarefas como resumir clipes de áudio, extrair palavras-chave ou gerar legendas.
Moderação
Um modelo ajustado que pode detectar se o texto pode ser sensível ou inseguro, como conter palavrões, discurso de ódio, informações pessoais ou spam. A moderação pode ser usada para filtrar conteúdo inadequado ou sinalizar possíveis problemas.
Modelos de código aberto da OpenAI
Ponto E
O Point-E é um novo modelo desenvolvido pela OpenAI que pode extrair e resumir os pontos principais de qualquer texto. Ele usa uma combinação de redes de auto-atenção e de ponteiros para identificar as sentenças e frases mais relevantes em um documento e gerar um resumo conciso. O Point-E pode ser aplicado a vários domínios, como artigos de notícias, artigos científicos, resenhas, e-mails etc. O Point-E é rápido, preciso e fácil de usar. Você pode experimentá-lo no OpenAI Playground ou ler mais sobre ele no blog da OpenAI.
Jukebox
Um modelo generativo que pode criar músicas com letras e vocais. Ele também pode remixar músicas existentes, alterar o estilo ou o gênero da música e gerar músicas do zero com base em nomes de artistas ou gêneros. O Jukebox é baseado em um modelo transformador treinado em um grande conjunto de dados de músicas de vários gêneros e artistas. O Jukebox foi lançado em abril de 2020 e tem 5 bilhões de parâmetros.
CLIP
Um modelo de visão que pode aprender com a supervisão de linguagem natural. Ele pode classificar imagens em milhares de categorias com base em rótulos de texto ou legendas. Também é capaz de realizar aprendizado zero-shot, o que significa que pode reconhecer objetos ou conceitos que nunca viu antes. O CLIP é um modelo de aprendizado contrastivo que aprende a associar imagens e textos maximizando sua concordância. O CLIP foi lançado em janeiro de 2021 e tem 400 milhões de parâmetros.
De acordo com o site da OpenAI, atualmente há 10 modelos disponíveis por meio da API (excluindo os de código aberto), com diferentes preços e níveis de acesso. No entanto, esse número pode mudar com o tempo, à medida que a OpenAI desenvolve novos modelos ou atualiza os existentes.
Tentaremos manter este artigo atualizado com as informações mais recentes Modelos OpenAI. Para saber mais sobre cada modelo e como usá-lo, você pode visitar a página de documentação da API da OpenAI.
A OpenAI é de código aberto?
Isso nos leva a outra pergunta comum feita pela maioria das pessoas: "A OpenAI é de código aberto"?
A OpenAI foi fundada em 2015 como uma entidade sem fins lucrativos com uma promessa de mais de $1 bilhão de vários doadores, incluindo Elon Musk, Reid Hoffman, Peter Thiel e outros. No entanto, nos últimos anos, a OpenAI mudou sua estrutura e estratégia, tornando-se um híbrido de entidade sem fins lucrativos e com fins lucrativos.
A OpenAI tem duas entidades: uma corporação sem fins lucrativos (OpenAI Inc.) e uma corporação com fins lucrativos (OpenAI LP). A entidade sem fins lucrativos supervisiona a visão e a governança da organização, enquanto a entidade com fins lucrativos desenvolve e implementa produtos e serviços de IA.
Investimentos da Microsoft na OpenAI
Em 2019, a OpenAI anunciou a criação da OpenAI LP, uma subsidiária com fins lucrativos que lhe permitiria levantar mais fundos de investidores e atrair os melhores talentos. A Microsoft investiu $1 bilhão na OpenAI LP e se tornou seu provedor de nuvem exclusivo. Em 2021, a OpenAI lançou seu braço comercial, o OpenAI Codex, que oferece acesso a seus poderosos modelos e serviços de IA mediante o pagamento de uma taxa. A Microsoft investiu mais $10 bilhões no OpenAI Codex em 2023.
Como resultado dessas mudanças, a OpenAI tornou-se menos transparente e mais reservada em relação a suas pesquisas e produtos. Por exemplo, a OpenAI não divulgou o código-fonte nem os dados de treinamento de seu modelo de linguagem mais recente e avançado, o GPT-4, que pode gerar textos coerentes e diversificados sobre praticamente qualquer assunto.
Como a Motherboard já observou anteriormente, isso é um completo retrocesso em relação aos princípios fundadores da OpenAI como uma entidade sem fins lucrativos e de código aberto. Os pesquisadores de IA estão alertando sobre as possíveis consequências de reter essas informações, como a criação de monopólios, o sufocamento da inovação e o aumento dos riscos de uso indevido e tendencioso.
Portanto, a resposta à pergunta "A OpenAI é de código aberto?" não é simples. Embora alguns de seus projetos e ferramentas ainda sejam de código aberto e estejam disponíveis no GitHub, outros são de código fechado e proprietários. A OpenAI afirma que ainda está comprometida com sua visão original de criar e garantir o uso seguro da IA geral que pode superar os humanos na maioria das tarefas, mas também reconhece que enfrenta compensações e desafios para equilibrar suas metas sociais e comerciais.
Considerações finais
Para resumir, a API OpenAI oferece atualmente 13 modelos GPT (quatro modelos GPT-4 e nove modelos GPT-3.5) e quatro modelos específicos de recursos (DALL-E, Whisper, Embeddings e Moderation). Esses modelos têm diferentes recursos, durações de contexto e status de disponibilidade, conforme explicado acima. Você pode saber mais sobre cada modelo e pontos de preço visitando a documentação da API da OpenAI ou o site da OpenAI.
Embora os modelos da OpenAI sejam populares no mercado, há muitos outros modelos avançados disponíveis, como Modelos Claude 3 do Anthropic, Gemini do Google, etc.
Respostas de 2
ótima postagem!
ótima postagem