Nếu bạn từng làm việc với Excel đủ lâu, mình cá là bạn đã gặp cảnh này ít nhất một lần: mở file ra, kéo xuống vài trăm dòng, rồi chợt nhận ra… “Ơ, sao dữ liệu này lặp lại hoài vậy?”. Tên khách hàng trùng, mã sản phẩm giống nhau, email copy tới copy lui. Nhìn mà chỉ muốn thở dài. Nhưng khoan, đừng hoảng. Remove Duplicates trong Excel 2016 sinh ra là để xử mấy chuyện rắc rối kiểu đó.
Tin vui là thao tác này không hề phức tạp. Tin vui hơn nữa: Excel 2016 làm rất nhanh, rất gọn. Chỉ cần vài cú click là dữ liệu sạch sẽ trở lại, nhẹ đầu hẳn ra.
1. Remove Duplicates là gì và tại sao bạn nên dùng?
Remove Duplicates hiểu nôm na là loại bỏ các dòng dữ liệu trùng nhau trong bảng Excel. “Trùng” ở đây có thể là:
-
Trùng toàn bộ dòng
-
Trùng theo một cột cụ thể (ví dụ trùng email nhưng khác tên)
-
Trùng theo nhiều cột kết hợp
Thử nghĩ xem, nếu bạn có danh sách 5.000 khách hàng mà trong đó có vài trăm bản ghi trùng, báo cáo sẽ lệch đi bao nhiêu? Gửi mail marketing cũng sai, thống kê cũng méo. Lúc này, Remove Duplicates giống như cái chổi thần kỳ, quét một phát là sạch.
Và hay ở chỗ, Excel không xóa bừa. Nó cho bạn chọn rất rõ: trùng theo cột nào, giữ lại cái gì, bỏ cái gì. Chủ động hẳn hoi.
2. Chuẩn bị trước khi xóa trùng: đừng bỏ qua bước này
Nghe thì hơi “già đời”, nhưng mình vẫn phải nói: hãy sao lưu dữ liệu trước. Chỉ cần copy sheet sang một sheet khác là đủ. Vì Remove Duplicates xóa là xóa thật, không hỏi lại đâu.
Tiếp theo, bạn nên:
-
Kiểm tra hàng tiêu đề (header)
-
Đảm bảo dữ liệu không có khoảng trắng thừa
-
Xác định rõ: bạn muốn xóa trùng theo cột nào?
Chỉ cần rõ mấy điều này là làm rất mượt.
3. Cách Remove Duplicates cơ bản trong Excel 2016
Giờ vào phần chính nhé.
Bước 1: Chọn vùng dữ liệu
Bạn có thể:
-
Bôi đen toàn bộ bảng
-
Hoặc chỉ chọn những cột liên quan
Mẹo nhỏ: nếu dữ liệu của bạn liền mạch, chỉ cần click vào một ô bất kỳ trong bảng là Excel sẽ tự hiểu.
Bước 2: Vào công cụ Remove Duplicates
Trên thanh menu:
Data → Remove Duplicates
Một hộp thoại hiện ra, và đây chính là “trung tâm điều khiển”.
Bước 3: Chọn cột để kiểm tra trùng
-
Tick vào cột bạn muốn so sánh
-
Nếu có hàng tiêu đề, nhớ tick My data has headers
Ví dụ:
-
Chỉ tick cột Email → xóa trùng theo email
-
Tick cả Họ tên + Email → chỉ xóa khi trùng cả hai
Nhấn OK. Excel xử lý trong nháy mắt.
4. Kết quả sau khi xóa trùng: Excel nói cho bạn biết hết
Sau khi chạy xong, Excel sẽ hiện một thông báo kiểu:
-
Bao nhiêu dòng trùng đã bị xóa
-
Bao nhiêu dòng dữ liệu duy nhất còn lại
Cảm giác lúc này khá đã. Nhìn bảng dữ liệu gọn gàng hẳn, không còn mấy dòng “bản sao vô duyên” nữa. Thật sự là nhẹ người!
5. Remove Duplicates theo một cột (tình huống hay gặp nhất)
Giả sử bạn có bảng:
-
Họ tên
-
Email
-
Số điện thoại
Tên có thể trùng, nhưng email thì phải là duy nhất. Lúc này bạn chỉ cần:
-
Chọn toàn bộ bảng
-
Vào Remove Duplicates
-
Chỉ tick cột Email
Excel sẽ giữ lại bản ghi đầu tiên, các bản ghi sau có email trùng sẽ bị xóa. Đơn giản, nhanh, không cần công thức gì cả.
6. Một vài lỗi thường gặp khi dùng Remove Duplicates
Không có công cụ nào hoàn hảo tuyệt đối, và Remove Duplicates cũng vậy. Một số lỗi hay gặp gồm:
-
Khoảng trắng thừa: “abc@gmail.com” và “abc@gmail.com ” nhìn giống nhưng Excel coi là khác
→ Giải pháp: dùng TRIM trước -
Khác chữ hoa – chữ thường: Excel không phân biệt hoa thường, nên “A” và “a” vẫn bị coi là trùng
-
Dữ liệu ghép từ nhiều nguồn: dễ có ký tự ẩn
→ Nên dán dưới dạng Values
Biết trước mấy lỗi này thì xử lý rất nhanh, không có gì căng.
7. Khi nào KHÔNG nên dùng Remove Duplicates?
Có một điều quan trọng: Remove Duplicates xóa dữ liệu gốc. Vì vậy, bạn không nên dùng khi:
-
Cần giữ toàn bộ dữ liệu để đối soát
-
Cần lọc tạm thời chứ không xóa
-
Muốn tạo danh sách duy nhất ở sheet khác
Trong mấy trường hợp đó, bạn nên dùng Advanced Filter hoặc PivotTable sẽ an toàn hơn. Nhưng nếu mục tiêu là “dọn dẹp nhanh”, thì Remove Duplicates vẫn là vua.
Remove Duplicates trong Excel 2016 là một tính năng nhỏ nhưng sức mạnh thì không hề nhỏ. Nó giúp bạn tiết kiệm thời gian, giảm sai sót, và quan trọng nhất là làm cho dữ liệu trở nên đáng tin cậy hơn. Chỉ cần hiểu đúng và dùng đúng, bạn sẽ thấy Excel bớt “khó ưa” đi rất nhiều.

