Video hướng dẫn lọc dữ liệu trong excel

Đã bao giờ các bạn phải xử lý một lượng dữ liệu rất lớn ở trong Excel từ vài chục ngàn cho đến hàng trăm ngàn dòng? Các công cụ filter haybảng pivot có thể một phần nào xử lý được những công việc trích lọc dữ liệu theo điều kiện, sắp xếp dữ liệu nặng nhọc này trong Excel cho bạn nhưng với tốc độ khá chậm, và đôi khi chúng ta còn có thể gặp trường hợp treo máy tính hoặc Excel ngừng hoạt động bởi vì lượng dữ liệu này quá lớn thậm chí Excel có thể thoát luôn và không thể khôi phục được dữ liệu? Khi tất cả các kĩ thuật xử lý dữ liệu bình thường trong excel đã được thử qua, các bạn có thể nghĩ đến SQL. Vậy SQL là gì và chúng ta sử dụng SQL trong Excel như thế nào? Bài viết và video này sẽ giúp cho các bạn có thêm một công cụ rất hữu dụng nữa để xử lý dữ liệu trong Excel.

Download excel file kèm theo video

SQL là cái gì?

SQL là từ viết tắt tiếng Anh của Structured Query Language, là một ngôn ngữ được phát triển chuyên để truy vấn dữ liệu từ một hệ thống quản trị cơ sở dữ liệu [Wikipedia].

Nói một cách đơn giản hơn thì SQL sẽ giúp chúng ta lấy dữ liệu từ bảng tính này sang bảng tính khác hoặc SQL sẽ giúp chúng ta lọc dữ liệu theo nhiều điều kiện khác nhau theo cách mà các công cụ truyền thống như Advanced Filter hay Bảng Pivot có thể gặp khó khăn khi xử lý rất nhiều dữ liệu.

Ví dụ về sử dụng SQL trong Excel

Bảng dữ liệu trong Video

Dưới đây là bảng dữ liệu được kết nối trực tiếp từ Excel Online, bạn cần sử dụng một trình duyệt Web hiện đại [Google Chrome, Firefox, Safari] để có thể xem được bảng Excel này trực tiếp. Tài liệu Excel này có thể được download tại đây

Trước khi xử lý bất kì dữ liệu nào, chúng ta cần đi tìm hiểu cấu trúc của bảng dữ liệu ở đây:

  • Bảng dữ liệu của chúng ta bao gồm 7 cột từ cột A cho đến cột G.
  • Vùng dữ liệu được lưu là A1:G20000
  • Mỗi cột chứa một thuộc tính của dữ liệu:
    1. Cột A: Ngày bán [OrderDate]
    2. Cột B: Vùng bán [Region]
    3. Cột C: Người bán [Rep]
    4. Cột D: Món hàng[Item]
    5. Cột E: Số lượng [Units]
    6. Cột F: Đơn giá [Unit Cost]
    7. Cột G: Thành tiền [Total]

Sử dụng SQL để lọc hay truy cập dữ liệu trong bảng tính

Sau khi xác định được bảng dữ liệu của chúng ta như thế nào, chúng ta có thể sử dụng SQL để truy cập dữ liệu này với những câu lệnh SQLsau:

Truy cập dữ liệu từ bảng tính Excel bằng SQL
  • Truy cập toàn bộ dữ liệu trong bảng tính
SELECT * FROM [A1:G20000]

Dấu * ở trong câu lệnh này nghĩa là chúng ta muốn dữ liệu của tất cả các cột. Nếu các bạn sử dụng file Excel trong video để thực hiện những câu lệnh SQL này, bạn cần thêm mi_sql vào đằng trước câu lệnh: mi_sql SELECT * FROM [A1:G20000]

  • Truy cập dữ liệu của một số cột nhất định: chúng ta ghi tên cột ra sau từ khoá SELECT và viết các cột ngăn cách nhau bằng dấu phẩy ,
SELECT OrderDate, Region, Rep, Item FROM [A1:G20000] Lọc dữ liệu bảng tính Excel bằng SQL
  • Lọc dữ liệu từ bảng tính Excel với 1 điều kiện: Lọc dữ liệu của những đơn hàng từ Hanoi
SELECT * FROM [A1:G20000] WHERE Region='Hanoi'

Câu lệnh SQL trên có nghĩa là: từ vùng dữ liệu A1:G20000, lọc ra những dòng mà cột Region có giá trị là Hanoi

Từ khoá WHERE giúp chúng ta liệt kê điều kiện khi lọc dữ liệu.

  • Lọc dữ liệu từ bảng tính Excel với nhiều điều kiện: Lọc dữ liệu của những đơn hàng từ Hanoi hoặc Danang
SELECT * FROM [A1:G20000] WHERE Region='Hanoi' OR Region='Danang'

Câu lệnh SQL trên có nghĩa là: từ vùng dữ liệu A1:G20000, lọc ra những dòng mà cột Region có giá trị là Hanoi hoặc Danang

Ngoài cách dùng từ khoá OR, chúng ta cũng có thể dùng từ khoá IN và câu lệnh SQL sẽ như sau:

SELECT * FROM [A1:G20000] WHERE Region IN ['Hanoi','Danang']
  • Lọc dữ liệu của những đơn hàng bán sản phẩm Pencil từ Hanoi
SELECT * FROM [A1:G20000] WHERE Region='Hanoi' AND Item='Pencil'

Câu lệnh SQL trên có nghĩa là: từ vùng dữ liệu A1:G20000, lọc ra những dòng mà cột Region có giá trị là Hanoi và cột Item có giá trị làPencil.

  • Lọc dữ liệu của những đơn hàng bán sản phẩm Pencil từ Hanoi và người bán là Jones
SELECT * FROM [A1:G20000] WHERE Region='Hanoi' AND Item='Pencil' AND Rep='Jones'
  • Lọc dữ liệu của những đơn hàng bán sản phẩm có đơn giá [Unit Cost] nhỏ hơn hoặc bằng $ 8.99
SELECT * FROM [A1:G20000] WHERE [Unit Cost] = 4.99 AND [Unit Cost]

Chủ Đề