CSV de trazado de Python
CSV significa valores separados por comas, un formato popular para almacenar datos estructurados. El archivo CSV contiene los datos en forma de tabla con filas y columnas.
A menudo necesitamos visualizar los datos almacenados en el archivo CSV. Para este propósito, Python proporciona diferentes tipos de gráficos para la visualización de datos.
Use matplotlib.pyplot
para visualizar los datos CSV en Python
Matplotlib
es una biblioteca de visualización de datos popular y de código abierto en Python. Tiene un submódulo llamado pyplot
, que se utiliza para trazar gráficos en Python.
Para usar matplotlib
, primero debemos instalarlo usando el siguiente comando.
#Python 3.x
pip install matplotlib
Usar gráfico de barras para visualizar datos CSV
Un gráfico de barras es un gráfico que contiene barras rectangulares que muestran los valores numéricos de los niveles de características categóricas como barras. Usaremos el método bar()
del módulo pyplot
para trazar un gráfico de barras.
En el siguiente código, hemos leído los datos del archivo CSV utilizando el método read_csv()
disponible en el módulo pandas
. Los nombres y calificaciones se recuperaron de los datos y se transformaron en listas.
La x
representa los nombres de los estudiantes de la variable independiente en el eje x. La lista y
representa las notas de los alumnos, que aparecerán en el eje y.
Usamos el método bar()
y pasamos los argumentos. El ancho de la barra es 0,5, y la leyenda es Marcas
.
Finalmente, hemos invocado el método show()
, que mostrará el gráfico de barras en la salida.
Código de ejemplo:
# Python 3.x
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv("Student.csv")
display(data)
st_name = data["ST_Name"]
marks = data["Marks"]
x = list(st_name)
y = list(marks)
plt.bar(x, y, color="g", width=0.5, label="Marks")
plt.xlabel("Names")
plt.ylabel("Marks")
plt.title("Marks of different students")
plt.legend()
plt.show()
Producción:
Usar diagrama de dispersión para visualizar datos CSV
Un gráfico de dispersión utiliza puntos para visualizar los datos como un par numérico (x,y) donde xey representan un valor. Si visualizamos la relación entre los datos del nombre de los estudiantes y sus notas usando un gráfico de dispersión, solo tenemos que llamar al método scatter()
proporcionando x
e y
como argumentos requeridos.
Código de ejemplo:
# Python 3.x
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv("Student.csv")
display(data)
st_name = data["ST_Name"]
marks = data["Marks"]
x = list(st_name)
y = list(marks)
plt.scatter(x, y, color="g", label="Marks")
plt.xlabel("Names")
plt.ylabel("Marks")
plt.title("Marks of different students")
plt.legend()
plt.show()
Producción:
Usar gráfico circular para visualizar datos CSV
Un gráfico circular es un gráfico circular dividido en muchos sectores. El área de un arco/sector representa su cantidad.
Usamos un gráfico circular para visualizar las calificaciones de los estudiantes en el siguiente código. Hemos llamado al método pastel()
y hemos pasado la lista de notas y nombres de estudiantes como etiquetas en el gráfico.
También hemos mostrado el porcentaje de cada porción usando el autopct
. El estudiante que obtuvo la puntuación más alta ocupa el área más grande del gráfico circular y viceversa.
Código de ejemplo:
# Python 3.x
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv("Student.csv")
display(data)
st_name = data["ST_Name"]
marks = data["Marks"]
x = list(st_name)
y = list(marks)
plt.pie(y, labels=st_name, autopct="%.2f%%")
plt.xlabel("Names")
plt.ylabel("Marks")
plt.title("Marks of different students")
plt.legend()
plt.show()
Producción:
Usar diagrama de líneas para visualizar datos CSV
Un gráfico de líneas es un gráfico que muestra información que cambia con el tiempo en forma de puntos de datos. Usaremos el método plot()
para trazar un gráfico de líneas.
En el siguiente código, hemos visualizado una muestra de datos de COVID por fechas a lo largo del eje x y el número de casos a lo largo del eje y usando un gráfico de líneas. Hemos llamado al método plot()
y le hemos pasado los argumentos necesarios.
El estilo de línea
representa el estilo de la línea, que en nuestro caso es discontinua pero continua por defecto. Los Marcadores
indican los puntos que representan los puntos de la línea.
Código de ejemplo:
# Python 3.x
import matplotlib.pyplot as plt
import pandas as pd
data = pd.read_csv("covid_cases.csv")
display(data)
date = data["Date"]
cases = data["No of Cases"]
x = list(date)
y = list(cases)
plt.plot(x, y, color="g", linestyle="dashed", marker="o", label="Covid Data")
plt.xlabel("Date")
plt.xticks(rotation=25)
plt.ylabel("No of Cases")
plt.title("No of new Covid Case")
plt.legend()
plt.show()
Producción:
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn