O primeiro passo é tratar os dados para que se tenha dimenções contaveis. Isso dependerá do tido de dado a ser tratado, mas o exemplo dado em aula foi a paratir da contagem de ocorrencias de certo evendo, idioma do filme, para se ter a dimenção a ser apresentada graficamente. Do CSV, se gera uma variavel, da qual se extrais as informações desejadas.
tmdb = pd.read_csv("tmdb_5000_movies.csv")
A partir desta variavel, se extrai a contagem de ocorrencia de linguagem, da coluna de interesse
tmdb.original_language.value_counts()
Uma tabela pode ser gerada
contagem_de_lingua = tmdb["original_language"].value_counts().to_frame().reset_index()
contagem_de_lingua.columns = ["original_language", "total"]
Agora com a biblioteca MatPlotLib, é simples graficar os dados
import matplotlib.pyplot as plt
plt.pie(contagem_de_lingua["total"], labels = contagem_de_lingua["original_language"])
Apesar do grafico tipo pizza ser analiticamente desinteressante, já que é dificil extrair informações dele de maneira visual, ele funciona bem para comparações entre graficos pizza. Por exemplo pra demonstrar o crescimento de alguma variavel após algum tempo. Acho que é bastante usada no mercado financeiro.