bởi NguyenIT vào 2024-11-08 17:09:54 | Cập nhật bởi NguyenIT vào 2024-11-21 13:29:22
Chia sẻ: Facebook | Twitter | Whatsapp | Linkedin Lượt truy cập: 15
Numpy (Numeric Python): là một thư viện toán học phổ biến và mạnh mẽ của Python. Cho phép làm việc hiệu quả với ma trận và mảng, đặc biệt là dữ liệu ma trận và mảng lớn với tốc độ xử lý nhanh hơn nhiều lần khi chỉ sử dụng “core Python” đơn thuần.
Hãy cùng tìm hiểu về thư viện này trong bài viết dưới đây:
- Mở Command Prompt và gõ lệnh: pip install numpy
import numpy as np
a) Khởi tạo mảng một chiều
#Khởi tạo mảng một chiều với kiểu dữ liệu các phần tử là Integer
arr = np.array([1,3,4,5,6], dtype = int)
#Khởi tạo mảng một chiều với kiểu dữ liệu mặc định
arr = np.array([1,3,4,5,6])
print(arr)
OUTPUT:
[1 3 4 5 6]
b) Khởi tạo mảng hai chiều
arr1 = np.array([(4,5,6), (1,2,3)], dtype = int)
print(arr1)
OUTPUT:
[[4 5 6]
[1 2 3]]
c) Khởi tạo mảng ba chiều
arr2 = np.array(([(2,4,0,6), (4,7,5,6)],
[(0,3,2,1), (9,4,5,6)],
[(5,8,6,4), (1,4,6,8)]), dtype = int)
print(arr2)
OUTPUT:
[[[2 4 0 6]
[4 7 5 6]]
[[0 3 2 1]
[9 4 5 6]]
[[5 8 6 4]
[1 4 6 8]]]
d) Khởi tạo với các hàm có sẵn
print("Kiểu dữ liệu của phần tử trong mảng:", arr2.dtype)
print("Kích thước của mảng:", arr2.shape)
print("Số phần tử trong mảng:", arr2.size)
print("Số chiều của mảng:", arr2.ndim)
Output:
Kiểu dữ liệu của phần tử trong mảng: int32
Kích thước của mảng: (3, 2, 4)
Số phần tử trong mảng: 24
Số chiều của mảng: 3
Truy cập phần tử trong mảng
Các phần tử trong mảng được đánh số từ 0 trở đi
print("arr[2]=", arr[2])
print("arr1[1:2]=", arr1[1,2])
print("arr2[1,2,3]=", arr2[1,1,3])
print("arr[0:3]=", arr[0:3])
print("arr1[:,:1]=", arr1[:,:2])
Output
arr[2]= 4
arr1[1:2]= 3
arr2[1,2,3]= 6
arr[0:3]= [1 3 4]
arr1[:,:1]= [[4 5]
[1 2]]
Đọc mảng từ file .txt
diem_2a = np.loadtxt("Diem_2A.txt", dtype = int, delimiter=",") #ở đây tất cả phần tử là số nguyên nên mình để kiểu int cho dễ nhìn, các phần tử phân tách nhau bởi dấu ","
print("File dữ liệu điểm lớp 2A:", diem_2a)
Các hàm thống kê
print("Giá trị lớn nhất của mảng arr là:", np.max(arr))
print("Giá trị nhỏ nhất của mảng arr là:", np.min(arr))
print("Tổng tất cả các phần tử của mảng arr là:", np.sum(arr))
print("Trung bình cộng tất cả các phần tử của mảng arr là:", np.mean(arr))
print("Giá trị trung vị của mảng arr là:", np.median(arr))
Output:
Giá trị lớn nhất của mảng arr là: 6
Giá trị nhỏ nhất của mảng arr là: 1
Tổng tất cả các phần tử của mảng arr là: 19
Trung bình cộng tất cả các phần tử của mảng arr là: 3.8
Giá trị trung vị của mảng arr là: 4.0
NumPy dtype
Basic Type | Available Numpy types | Comments |
Boolean | bool | Elements are 1 byte in size. |
Integer | int8, int16, int32, int64, int128, int | int defaults to the size of int in C for the platform. |
Unsigned Integer | uint8, uint16, uint32, uint64, uint128, uint | uint defaults to the size of unsigned int in c for the platform. |
Float | float32, float64, float, longfloat | Float is always a double precision floating point value (64 bits). longfloat represents large precision floats. Its size is platform dependent. |
Complex | complex64, complex128, complex | The real and complex elements of a complex64 are each represented by a single precision (32 bit) value for a total size of 64 bits. |
Strings | str, unicode | Unicode is always UTF32 (UCS4) |
Object | object | Represent items in array as Python objects. |
Records | void | Used for arbitrary data structures in record arrays. |
Toán tử trong NumPy Array
a = np.array([2,1,3,4,5])
Toán tử | Ví dụ | Kết quả |
(+) Một số với mảng | 3 + arr arr +3 | [4, 6, 7, 8, 9] |
(+) Mảng với mảng | arr + a a + arr | [3, 4, 7, 9, 11] |
(-) Một số với mảng | arr - 3 3 - arr | [-2, 0, 1, 2, 3] [2, 0, -1, -2, -3] |
(-) Mảng với mảng | arr - a a - arr | [-1, 2, 1, 1, 1] [1, -2, -1, -1, -1] |
(*) Một số với mảng | arr * 3 3 * arr | [3, 9, 12, 15, 18] |
(*) Mảng với mảng | arr * a a * arr | [2, 3, 12, 20, 30] |
(/) Một số với mảng | arr / 3 3 / arr | [0.33333333, 1., 1.33333333, 1.66666667, 2.] [3., 1., 0.75, 0.6, 0.5] |
(/) Mảng với mảng | arr / a a / arr | [0.5, 3., 1.33333333, 1.25, 1.2] [2., 0.33333333, 0.75, 0.8, 0.83333333] |
Hạng của ma trận | np.rank(arr) np.rank(arr1) | 1 2 |
Như vậy là mình đã giới thiệu cơ bản cho bạn về thư viện NumPy trong Python, nếu bạn muốn tìm hiểu thêm về thư viện NumPy thì bạn có thể vào ĐÂY để tham khảo thêm. Ở bài sau mình sẽ giới thiệu cho các bạn về cách xử lý dữ liệu với thư viện Pandas.