FuncionalidadesCasos de UsoBlogReferência APIPor Que CorePlexMLPreços
Começar Grátis

Preparação de dados conversacional

Converse com um assistente de IA alimentado por LLMs da OpenAI e Anthropic para preparar seus dados. Envie CSV/Excel/JSON/XML, limpe, transforme, codifique — tudo através de conversa natural.

platform.coreplexml.io
Interface conversacional de IA do Dataset Builder com assistente de preparação de dados

Pipeline de preparacao de dados em 6 passos

Do upload bruto ao dataset pronto para ML. Cada passo guiado por IA, cada transformacao mostrada como Python executavel.

1. Carregar e Explorar

Envie seu arquivo (CSV, Excel, JSON, XML). A IA detecta automaticamente o esquema, os tipos de coluna, os valores ausentes e os problemas de qualidade de dados.

2. Limpar

Lide com valores ausentes (media, mediana, preenchimento progressivo), remova duplicatas, corrija outliers e descarte colunas irrelevantes — tudo via conversa.

3. Transformar

Conversao de tipos, extracao de features de datas, normalizacao de texto, agrupamento e expressoes personalizadas. Diga a IA o que voce precisa em portugues.

4. Codificar e Escalar

One-hot encoding, label encoding, StandardScaler, MinMaxScaler. A IA sugere a melhor abordagem com base nos seus dados e na variavel alvo.

5. Selecao de Features

Selecione ou descarte features para modelagem. A IA recomenda com base em analise de correlacao e importancia de features do perfilamento inicial.

6. Exportar

Exporte como dataset versionado pronto para IA. Rastreamento completo de linhagem — cada transformacao registrada com o script Python gerado.

Key Capabilities

Everything you need to get the most out of this module.

Ingestão Multi-Formato

Envie arquivos CSV, Excel, JSON ou XML. Detecção automática de esquema e inferência de tipos.

Transformações Inteligentes

Conversão de tipos, one-hot encoding, label encoding, escalonamento, imputação — tudo via linguagem natural.

Execução Transparente

Veja os scripts Python gerados para cada transformação. Reprodutibilidade completa garantida.

Controle de Versões

Versionamento de datasets com diff de esquemas. Rastreie cada mudança e reverta quando necessário.

Converse com seus dados

Impulsionado por LLMs da OpenAI e Anthropic. Descreva o que voce precisa em portugues — a IA gera e executa o codigo de transformacao para voce.

VOCE

Descarte as colunas com mais de 50% de valores ausentes

IA

Encontrei 3 colunas que superam o limiar: fax_number (87% nulo), middle_name (62% nulo) e alt_phone (54% nulo). Estou removendo-as agora.

VOCE

Preencha as idades ausentes com a mediana e codifique genero com one-hot

IA

Pronto. Preenchi 47 valores de idade ausentes com a mediana (34.0). Criei as colunas gender_male e gender_female. Script salvo para reprodutibilidade.

Mais de 15 tipos de transformacao

De imputacao simples a engenharia de features complexa. Tudo disponivel via linguagem natural ou a API.

Imputacao

Preencha valores ausentes com media, mediana, moda, preenchimento progressivo, preenchimento regressivo ou valores personalizados. Estrategias especificas por coluna.

One-Hot Encoding

Converta colunas categoricas em colunas indicadoras binarias. Lide com alta cardinalidade com limiares configuraveis.

Label Encoding

Codificacao ordinal para categorias ordenadas. Preserva a ordem natural (baixo < medio < alto).

Escalamento

StandardScaler (pontuacao z) ou MinMaxScaler (faixa 0-1). Essencial para modelos baseados em distancia e redes neurais.

Extracao de Datas

Extraia ano, mes, dia, dia da semana, hora de colunas datetime. Crie multiplas features numericas a partir de uma unica data.

Agrupamento (Binning)

Agrupe valores continuos em bins discretos. Largura igual, frequencia igual ou limites personalizados.

Normalizacao de Texto

Minusculas, remover espacos, eliminar caracteres especiais. Padronize colunas de texto antes de codificar.

Descartes Personalizados

Elimine colunas por nome, limiar de nulos alto ou deteccao de variancia zero. A IA recomenda descartes com base na qualidade dos dados.

Conversao de Tipos

Converta texto em numerico, analise datas, corrija colunas de tipo misto. Lide com casos especiais como simbolos de moeda e porcentagens.

Formatos de Arquivo
CSV, Excel, JSON, XML
Motor de IA
OpenAI + Anthropic
Tipos de Transformacao
15+
Historico de Versoes
Linhagem completa
Transparencia de Codigo
Scripts Python exibidos
Deteccao de Esquema
Automatica
Formatos de Exportacao
CSV, Parquet
Estado da Sessao
Persistente e retomavel

ETL conversacional via codigo

Integre o pipeline de preparacao de dados com IA nos seus fluxos de trabalho. Converse, transforme e exporte programaticamente.

prepare_data.py
from coreplexml import CorePlexMLClient

client = CorePlexMLClient(
    base_url="https://api.coreplexml.io",
    api_key="sk_your_api_key"
)

# Start a conversational ETL session
session = client.builder.create_session(
    project_id="proj_abc",
    file_path="raw_customers.csv"
)
print(f"Session: {session['id']}")
print(f"Rows: {session['row_count']}, Cols: {session['col_count']}")

# Chat with the AI to clean data
resp = client.builder.chat(
    session_id=session["id"],
    message="Drop the customer_id column and fill missing ages with median"
)
print(resp["reply"])
print(f"Script: {resp['script']}")  # Shows generated Python

# Execute the cleaning step
result = client.builder.execute(
    session_id=session["id"],
    step="cleaning"
)
print(f"Rows after cleaning: {result['row_count']}")

# Ask for encoding recommendations
resp = client.builder.chat(
    session_id=session["id"],
    message="One-hot encode the categorical columns and scale numerics"
)

# Export the prepared dataset
final = client.builder.finalize(session_id=session["id"])
print(f"Dataset version: {final['dataset_version_id']}")
print(f"Ready for AutoML training")

API de Dataset Builder

Endpoints para sessoes conversacionais, execucao de passos e exportacao de datasets.

POST
/api/builder/sessions

Criar uma nova sessao com upload de arquivo (multipart)

POST
/api/builder/sessions/{id}/chat

Enviar uma mensagem em linguagem natural, obter resposta + plano de IA

POST
/api/builder/sessions/{id}/steps/{step}/propose

Gerar plano de transformacao e script Python

POST
/api/builder/sessions/{id}/steps/{step}/execute

Executar o passo de transformacao proposto

POST
/api/builder/sessions/{id}/finalize

Exportar dataset pronto para IA como recurso versionado

GET
/api/builder/sessions/{id}

Obter estado da sessao, passo atual e pre-visualizacao de dados

Do upload a analise

platform.coreplexml.io/datasets/...
Visao geral do dataset com estatisticas de colunas e perfilamento de dados

Visao geral do dataset com estatisticas por coluna

platform.coreplexml.io/datasets/.../visualizations
Graficos de distribuicao de dados e analise de visualizacao

Visualizacoes de dados interativas e distribuicoes

Pronto para comecar?

Comece a construir com CorePlexML hoje. Plano gratuito disponivel — nao e necessario cartao de credito.