github blob

GITHUB BLOG

Prever Diabetes

bruno-valerohá cerca de 2 anosmain

Prever Diabetes com Machine Learning

Este é um Mini-Projeto idealizado pela Data Science Academy, onde o objetivo é Criar um Modelo de Machine Learning que saiba identificar se uma pessoa está ou não com Diabetes, o treinamento do modelo é feito com base em dados sobre substâncias que fazem parte do organismo humano.

Atenção!

O objetivo deste projeto é praticar e aprender como se constrói um Modelo de Machine Learning, não é feito para diagnosticar se uma pessoa está de fato com Diabetes, ou não. O modelo foi treinado com pouquíssimos dados, e ainda por cima, muitos deles continham valores ausentes, onde foi necessário preencher estes valores com a média de valores daquela determinada categoria. Este é outro motivo para não se levar a sério o resultdo do teste.

Accuracy (Acurácia ou Exatidão):

Com base nos dados que foram passados, o modelo conseguiu atingir uma acurácia de aproximadamente 73%, essa é uma boa margem de estimativa quando estamos lidando com assuntos banais. Porém diagnosticar Diabetes, não é banal. Seria necessário obter uma taxa de acerto muito maior do que essa para que este trabalho pudesse, se quer, ser visto como importante aos olhos da Medicina, mas como dito anteriormente, ele foi feito com o objetivo de praticar programação, e não de diagnosticar pessoas.

Quer Fazer o Teste?

Um dos arquivos acima se chama "prever_diabetes.py", nele está o código desenvolvido para criar um sisteminha que é o responsável por fazer as perguntas necessárias, e então com base nas respostas fornecidas, apresentar a probabilidade de Diabetes positivo. Para fazer o teste, baixe o código em seu computador e execute-o através do prompt, jupyter, visual studio, ou similares.

Quer ver como foi Construído o Modelo de Machine Learning?

Um dos arquivos acima se chama "Diabetes_Construcao_do_Modelo.ipynb", nele você poderá acompanhar todo o processo de tratamento e análize dos dados, juntamente com as observações sobre todos os acontecimentos do processo. Mais pro final o modelo é treinado e testado com 3 diferentes algorítimos na tentativa e otimizar a acurácia do modelo