📊 SentimentoAPI - Inteligência Artificial & Microserviços

Hackathon 2025-2026 (Oracle + Alura)

🌐 Acesso Direto (Cloud)

O ecossistema está operacional na Oracle Cloud e pode ser acessado publicamente nos seguintes endereços:

🚀 Playground Interativo (Streamlit): http://137.131.172.156:8501
📊 Dashboard Administrativo (Java): http://137.131.172.156:8081
🔌 Endpoint de API (JSON): http://137.131.172.156:8081/sentiment

🏗️ Jornada do Projeto: Do Modelo à API

O desenvolvimento seguiu uma estrutura rigorosa de Ciência de Dados integrada à Engenharia de Software, focada na transição fluida entre a exploração de dados e a entrega de valor em produção.

1. Desenvolvimento e Seleção do Modelo

Exploração e Processamento: Realizamos a limpeza de dados e a vetorização utilizando a técnica TF-IDF para destacar termos carregados de sentimento.
Modelos Testados: Foram avaliados diversos algoritmos, incluindo Regressão Logística, Gradient Boosting, CatBoost e Random Forest.
Otimização: O modelo final foi selecionado por apresentar o melhor alinhamento aos objetivos de negócio, utilizando ajustes de threshold para otimizar a precisão das previsões.

2. Implementação e Inferência

Contrato da API: O sistema recebe entradas de texto e retorna uma predição binária (Positivo/Negativo) com a respectiva probabilidade.
Lógica de Inferência: A API processa os dados em tempo real, atingindo índices de confiança de até 98% em textos de alta clareza semântica.

Hackathon MVP: Solução automatizada para classificação de feedbacks de clientes utilizando Processamento de Linguagem Natural (NLP).

💡 Sobre o Projeto

Empresas recebem milhares de comentários diariamente e não conseguem ler todos manualmente. A SentimentoAPI oferece uma solução automática para classificar mensagens e gerar informações acionáveis, permitindo:

Triagem Ágil: Identificar rapidamente se o tom é positivo ou negativo.
Priorização: Direcionar respostas imediatas a críticas severas.
Métricas de Qualidade: Gerar indicadores de satisfação (CSAT/NPS) ao longo do tempo.

🎯 Setor de Negócio

Focado em Atendimento ao Cliente, Marketing e Operações que buscam entender a saúde da marca através de avaliações, redes sociais e pesquisas de satisfação em escala.

🚀 Tecnologias

Componentes de Infraestrutura:

Oracle Cloud (OCI): Hospedagem em instância VM Ubuntu, utilizando regras de segurança para liberação de portas (8081) e firewall (iptables/ufw).
Docker Hub: Imagens versionadas e distribuídas publicamente para facilitar o deploy contínuo.
- marcosynky/hackaones:java-api
- marcosynky/hackaones:python-ia
Docker Compose: Orquestração de 3 containers (Frontend/API Java, Microserviço Python e Banco Postgres).

📊 Estado do Projeto

🏗️ Arquitetura Técnica

O projeto demonstra a integração entre Data Science e Engenharia de Software utilizando uma arquitetura de microserviços para superar as limitações de interoperabilidade entre Java e Python.

graph LR
   A[Usuário/Frontend] -->|POST /sentiment| B{API Spring Boot}
   B -->|RestTemplate| C[Microserviço Python]
   C -->|Modelo .pkl| D[Inferência de IA]
   D -->|Previsão| C
   C -->|JSON| B
   B -->|Persistência| E[(PostgreSQL)]
   B -->|Resposta| A
   
   A -.->|PUT/DELETE| B
   A -.->|GET /stats| B

🛠️ Arquitetura de Microserviços

O projeto utiliza uma rede conteinerizada para garantir que cada componente execute sua função de forma isolada e eficiente:

Serviço	Tecnologia	Função Principal
Back-End	Java Spring Boot	Orquestração, Gateway de API e Persistência no banco.
Motor de IA	Python Flask	Execução do modelo de Machine Learning e Inferência.
Interface	Streamlit	Interface amigável para análise multilíngue e testes rápidos.
Banco de Dados	PostgreSQL	Armazenamento de históricos para auditoria e análise temporal.

Data Science

Python 3.9
Scikit-learn (Modelo de Regressão Logística)
Pandas (Manipulação de dados)
TF-IDF Vectorizer (Processamento de texto)
Joblib (Serialização do modelo)
Flask (Exposição do modelo como API)

Infraestrutura

Docker & Docker Compose

🚀 Como Executar

Pré-requisito: Treinamento do Modelo

Antes de subir os containers, é necessário gerar o arquivo binário do modelo de IA.

Acesse a pasta ds-python.
Execute o script de treinamento (necessário Python instalado localmente ou executar dentro de um container isolado):
```
python treinar_modelo.py
```
Isso criará o arquivo sentiment_model.joblib.

Opção 1: Rodando com Docker (Recomendado)

Na raiz do projeto (onde está o docker-compose.yml):

docker-compose up --build

Aguarde até ver as mensagens de log indicando que ambos os serviços iniciaram.

API Principal: http://localhost:8081
Serviço de IA (Interno): http://localhost:5000

Opção 2: Rodando Manualmente

1. Subir o Serviço de Data Science:

cd ds-python
pip install -r requirements.txt
python app_python.py
# O serviço rodará na porta 5000

2. Subir o Back-End Java:

cd backend-java
./mvnw spring-boot:run
# O serviço rodará na porta 8080

🔌 Documentação da API

Endpoint: Classificar Sentimento

Analisa um texto e retorna a previsão do sentimento e a confiança do modelo.

URL: /sentiment
Método: POST
Content-Type: application/json

Exemplo de Requisição (Body)

{
  "text": "O produto chegou rápido e a qualidade é excelente!"
}

Exemplo de Resposta (Sucesso - 200 OK)

{
  "previsao": "Positivo",
  "probabilidade": 0.92
}

Exemplo de Resposta (Negativo)

{
  "text": "Péssimo atendimento, nunca mais compro."
}

Saída:

{
  "previsao": "Negativo",
  "probabilidade": 0.88
}

Tratamento de Erros

400 Bad Request: Se o campo text estiver vazio ou nulo.
500 Internal Server Error: Caso o serviço de IA esteja indisponível.

🧠 Detalhes do Modelo de Data Science

Para este MVP, optamos por uma abordagem clássica e eficiente de Machine Learning Supervisionado:

Pré-processamento: Limpeza básica de texto.
Vetorização (TF-IDF): Transformamos os textos em números baseados na frequência e importância das palavras no corpus.
Algoritmo (Regressão Logística): Escolhido por ser rápido, interpretável e apresentar excelente desempenho para classificação binária de textos curtos.
Métricas: O modelo retorna não apenas a classe (Pos/Neg), mas a probabilidade (predict_proba), permitindo definir thresholds de confiança.

🗄️ Camada de Dados (Persistência)

O sistema utiliza o Spring Data JPA com Hibernate para gerenciar a persistência. O modelo de dados é composto por:

Tabela comentario_tb: Armazena o texto bruto do feedback e a data de criação.
Tabela sentiment_prediction_tb: Armazena o rótulo gerado pela IA (Positivo/Negativo) e a probabilidade (confiança) da análise.

Configurações de Banco no Docker:

As credenciais são gerenciadas via variáveis de ambiente no docker-compose.yml, garantindo segurança e flexibilidade:

URL: jdbc:postgresql://db:5432/sentiment
Dialeto: PostgreSQLDialect
Destaque: Configuração de non_contextual_creation: true para lidar com campos de texto longo (LOB).

Desenvolvido pela Equipe para o Hackathon 2025.

📝 Descrição Geral do Projeto

🎯 Setor de Negócio

Atendimento ao Cliente / Marketing / Operações Empresas que coletam grandes volumes de opiniões (avaliações, redes sociais, pesquisas de satisfação) e precisam de agilidade para classificar sentimentos em escala.

💻 O Projeto

Desenvolvimento de um ecossistema de microserviços capaz de receber textos brutos e aplicar modelos de Processamento de Linguagem Natural (NLP) para classificação de sentimento. A solução retorna resultados em formato JSON, permitindo o consumo imediato por dashboards ou sistemas de suporte.

👤 Necessidade do Cliente

Clientes corporativos enfrentam o desafio de processar feedbacks manualmente. Este projeto oferece:

Triagem Ágil: Identificar rapidamente se o tom é positivo, neutro ou negativo.
Priorização: Direcionar respostas imediatas a críticas severas (comentários negativos).
Análise Temporal: Medir a evolução da satisfação do cliente ao longo do tempo.

📈 Validação de Mercado

A análise de sentimento é uma ferramenta estratégica para:

Acelerar o atendimento (identificação de urgências).
Monitorar o impacto de campanhas de marketing.
Fornecer métricas acionáveis para PMEs que não possuem equipes de dados dedicadas.

🏗️ Arquitetura e Entregáveis (Hackathon MVP)

O projeto demonstra a integração real entre Data Science e Engenharia de Software utilizando uma arquitetura de microserviços para superar as limitações de interoperabilidade entre Java e Python.

1. Data Science (Python)

Focado no treinamento e exposição do modelo de IA:

Notebook Jupyter: EDA (Exploração de Dados), limpeza e treinamento.
Modelo: Pipeline utilizando TF-IDF + Regressão Logística.
API de Inferência: Flask/FastAPI carregando o modelo serializado (.joblib) e expondo o endpoint de predição.

2. Back-End (Java Spring Boot)

Atua como o Gateway da aplicação e orquestrador de dados:

Endpoint REST: /sentiment para recepção de requisições.
Integração: Consumo do microserviço Python via RestTemplate.
Persistência: Armazenamento de históricos em banco de dados (H2/PostgreSQL).
Dashboard: Cálculo de estatísticas de sentimento (positivo/negativo).

🛠️ Funcionalidades do MVP

Funcionalidade	Descrição
Predição Online	Endpoint `POST` que recebe texto e retorna label + probabilidade.
Persistência	Gravação automática de todas as consultas para auditoria e métricas.
Métricas (`/stats`)	Resumo percentual de satisfação dos últimos registros.
Processamento em Lote	Suporte a upload de arquivos CSV para análise massiva.
Validação	Tratamento de erros para textos vazios ou indisponibilidade da IA.

🌟 Funcionalidades Extras (Diferenciais)

Detecção Automática de Idioma: Suporte a Português (PT) e Espanhol (ES) via langdetect.
Interface de Teste Streamlit: Playground interativo para validação rápida de hipóteses.
Arquitetura Híbrida: Frontend Streamlit consumindo API Java em Nuvem. 👉 URL: http://137.131.172.156:8501

🔒 Segurança e Infraestrutura

A aplicação está hospedada em uma instância Ubuntu na Oracle Cloud, protegida por regras rígidas de Ingress (Firewall):

Portas Liberadas: 8081 (Java API), 8501 (Streamlit UI), 5000 (Python IA) e 5434 (PostgreSQL).
Orquestração: Gestão simplificada via Docker Compose, permitindo replicação idêntica do ambiente de desenvolvimento em produção.

🧠 Conceito Técnico: Vetorização TF-IDF

Para converter palavras em números compreensíveis pela máquina, utilizamos a técnica TF-IDF ($Term Frequency - Inverse Document Frequency$): $$w_{i,j} = tf_{i,j} \times \log(\frac{N}{df_i})$$

Isso garante que palavras irrelevantes (como "o", "a", "de") tenham menos peso, enquanto palavras carregadas de sentimento (como "péssimo", "excelente") sejam as protagonistas na decisão do modelo.

Desenvolvido pela Equipe HackaOnes para o Hackathon 2025.

Name		Name	Last commit message	Last commit date
Latest commit History 86 Commits
.idea		.idea
.mvn/wrapper		.mvn/wrapper
.vscode		.vscode
Hackathon-One-Data-Science/Arquvios Data		Hackathon-One-Data-Science/Arquvios Data
HackathonONE-Back-End		HackathonONE-Back-End
src		src
.gitattributes		.gitattributes
.gitignore		.gitignore
Data		Data
Docker-compose.yml		Docker-compose.yml
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
mvnw		mvnw
mvnw.cmd		mvnw.cmd
pom.xml		pom.xml

Uh oh!

License

ORGHackathons/hackathonONE

Folders and files

Latest commit

History

Repository files navigation

📊 SentimentoAPI - Inteligência Artificial & Microserviços

🌐 Acesso Direto (Cloud)

🏗️ Jornada do Projeto: Do Modelo à API

1. Desenvolvimento e Seleção do Modelo

2. Implementação e Inferência

💡 Sobre o Projeto

🎯 Setor de Negócio

🚀 Tecnologias

Componentes de Infraestrutura:

📊 Estado do Projeto

🏗️ Arquitetura Técnica

🛠️ Arquitetura de Microserviços

Data Science

Infraestrutura

🚀 Como Executar

Pré-requisito: Treinamento do Modelo

Opção 1: Rodando com Docker (Recomendado)

Opção 2: Rodando Manualmente

🔌 Documentação da API

Endpoint: Classificar Sentimento

Exemplo de Requisição (Body)

Exemplo de Resposta (Sucesso - 200 OK)

Exemplo de Resposta (Negativo)

Tratamento de Erros

🧠 Detalhes do Modelo de Data Science

🗄️ Camada de Dados (Persistência)

Configurações de Banco no Docker:

📝 Descrição Geral do Projeto

🎯 Setor de Negócio

💻 O Projeto

👤 Necessidade do Cliente

📈 Validação de Mercado

🏗️ Arquitetura e Entregáveis (Hackathon MVP)

1. Data Science (Python)

2. Back-End (Java Spring Boot)

🛠️ Funcionalidades do MVP

🌟 Funcionalidades Extras (Diferenciais)

🔒 Segurança e Infraestrutura

🧠 Conceito Técnico: Vetorização TF-IDF

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Sponsor this project

Uh oh!

Packages 0

Contributors 7

Uh oh!

Languages

Packages