Open
Conversation
…-s17-s18-projeto-final # Conflicts: # README.md
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
Turma Online 34 | Python | Semanas 17 e 18 | 2024 |
Instruções
Turma Online 34 | Python | Semanas 17 e 18 | 2024 |
Realizado o Fork do repositório https://github.com/reprograma/on34-python-s17-s18-projeto-final
Clonei o fork na minha máquina (Para isso basta abrir o seu terminal e digitar
git clone url-do -repositorio-forkado)Add o arquivo da base de dados e o colab, bem como o README.
Commit – m : das atualizações/ alterações
Git Status: para verificação se está tudo ok
Git push: para enviar as mudanças para o repositório remoto
fonte de dados escolhida
Análise exploratória
Semana destinada a esse tipo de análise para entendimento da base.
Nessa etapa foi usado comandos da biblioteca pandas e matplotlib
Foram usados funções como:
.DataFrame é uma estrutura de dados bidimensional amplamente usada na biblioteca pandas do Python. Ele se assemelha a uma tabela (como em uma planilha do Excel ou uma tabela SQL), onde os dados são organizados em linhas e colunas.
A função value_counts() é muito usada em Pandas para contar a frequência de valores únicos em uma coluna de um DataFrame.
A função sort_index(): é utilizada para ordenar os dados de uma Series ou DataFrame de acordo com o índice.
A função groupby() do pandas é usada para agrupar dados com base em uma ou mais colunas e realizar operações agregadas, como somas, médias, contagens, etc., em cada grupo
A função crosstab() do pandas é usada para criar uma tabela de frequência cruzada entre duas ou mais colunas. Ela é útil para gerar tabelas de contingência que mostram a relação entre variáveis categóricas, como a contagem de ocorrências entre elas.
Criando uma história com dados
Conteúdo
O que é um projeto de análise de dados?
Nesse ponto vocês já aprenderam que ter dados não é a mesma coisa que ter informação.
Dados: são elementos brutos e não processados, como números, palavras, ou símbolos que precisam ser interpretados para se tornarem úteis.
Informação: é o resultado do processamento, organização e interpretação dos dados, fornecendo significado e contexto para tomar decisões ou entender situações.
Assim, dados são a matéria-prima da informação, que é o produto final após análise e interpretação dos dados.
Por isso a importância de nós contarmos uma história estruturada a partir dos dados que conseguimos coletar. E é exatamente sobre isso, que se trata um projeto de análise de dados: gerar informação útil a partir da construção de uma perspectiva contextualizada!
Então aqui vão algumas perguntas gerais que devemos nos fazer ao iniciar um projeto como esse:
Conteúdo
Compreender a percepção dos entrevistados sobre seu estado mental em relação ao tempo dedicada a telas.
Público
Projeto destinado a conclusão de curso do Análise de dados Reprograma
O conteúdo da base é relevante para compreender qual a percepção dos entrevistados frente ao uso de telas
Transformação
O conteúdo é relevante para analisar o nível de aprendizado, bem como ter acesso as informações relacionadas a base de dados
Objetivo
Saúde mental e uso de tecnologia
Escolha da Base de Dados
https://www.kaggle.com/datasets/waqi786/mental-health-and-technology-usage-dataset?resource=download
O objetivo da análise é compreender a percepção dos entrevistados sobre seu estado mental em relação ao tempo dedicada a telas.
Verificar o padrão de horas dedicadas a horas de sono e atividade física.
Verificar a percepção sobre o impacto no trabalho em relação ao uso de telas.
Base de Dados