DEV Community

Phuong Tran (IT)
Phuong Tran (IT)

Posted on

Find Remove duplicated files in Google Drive

Để tìm và xóa các file trùng lặp trong thư mục Google Drive trên máy tính, bạn không nhất thiết phải cài đặt các ứng dụng phần mềm của bên thứ ba vào máy. Thay vào đó, bạn hoàn toàn có thể sử dụng các đoạn script (mã lệnh) chạy trực tiếp trên nền tảng đám mây của Google hoặc sử dụng Command Prompt/Terminal kết hợp với các công cụ mã nguồn mở.

Dưới đây là 3 cách phổ biến từ việc không cần cài gì cho đến dùng script/command line:


Cách 1: Sử dụng Google Apps Script (Không cần cài phần mềm, chạy trực tiếp trên trình duyệt)

Google cung cấp một môi trường lập trình trực tuyến gọi là Google Apps Script. Bạn có thể viết một đoạn mã ngắn để tự động quét toàn bộ Drive của mình, tìm các file trùng tên (hoặc trùng dung lượng) và đưa chúng vào danh sách để xóa hoặc tự động chuyển vào Thùng rác.

Cách thực hiện:

  1. Truy cập vào trang script.google.com.
  2. Nhấn vào Dự án mới (New Project).
  3. Xóa hết mã mặc định và dán đoạn mã script (JavaScript) sau vào để tìm các file trùng tên trong một thư mục cụ thể (hoặc toàn bộ Drive):
function findAndTrashDuplicates() {
  // Thay 'ID_THU_MUC_CUA_BAN' bằng ID thư mục trên link Google Drive của bạn
  // Ví dụ: https://drive.google.com/drive/folders/1A2B3C... -> ID là 1A2B3C...
  var folderId = 'ID_THU_MUC_CUA_BAN'; 
  var folder = DriveApp.getFolderById(folderId);
  var files = folder.getFiles();

  var fileMap = {};

  while (files.hasNext()) {
    var file = files.next();
    var name = file.getName();

    if (fileMap.hasOwnProperty(name)) {
      fileMap[name].push(file);
    } else {
      fileMap[name] = [file];
    }
  }

  for (var name in fileMap) {
    if (fileMap[name].length > 1) {
      // Sắp xếp để giữ lại file mới nhất hoặc cũ nhất tùy bạn
      // Ở đây ta giữ lại file đầu tiên tìm thấy, đưa các file trùng lặp còn lại vào Thùng rác
      for (var i = 1; i < fileMap[name].length; i++) {
        Logger.log('Đang xóa file trùng lập: ' + name);
        fileMap[name][i].setTrashed(true); // Di chuyển vào Trash
      }
    }
  }
  Logger.log('Hoàn thành quét file trùng!');
}

Enter fullscreen mode Exit fullscreen mode

  1. Nhấn nút Lưu (Save) (biểu tượng đĩa ảo) và nhấn Chạy (Run). Hệ thống sẽ yêu cầu bạn cấp quyền truy cập vào Drive của chính bạn để quét file.

Cách 2: Sử dụng Command Prompt / Terminal với công cụ Rclone (Dành cho người thích dùng dòng lệnh)

Nếu bạn đã cài đặt công cụ Google Drive cho máy tính (Google Drive for Desktop), các file của bạn sẽ xuất hiện như một ổ đĩa ảo (ví dụ ổ G:\). Tuy nhiên, việc quét file trùng trực tiếp bằng Command Prompt của Windows rất phức tạp và dễ nhầm lẫn.

Thay vào đó, dân công nghệ thường sử dụng một công cụ dòng lệnh mã nguồn mở cực mạnh tên là Rclone (không cần cài đặt cài cắm phức tạp, chỉ cần tải file .exe về chạy). Rclone có khả năng tương tác trực tiếp với API của Google Drive để tìm file trùng dựa trên mã băm MD5 (tức là trùng chính xác 100% nội dung, bất kể tên file có giống nhau hay không).

Cách thực hiện bằng Command Line:

  1. Tải Rclone về máy tính và cấu hình kết nối tới tài khoản Google Drive của bạn (qua lệnh rclone config).
  2. Mở Command Prompt (cmd) và chạy lệnh sau để tìm các file trùng lặp:
rclone dedupe google_drive:Thư_mục_của_bạn

Enter fullscreen mode Exit fullscreen mode
  1. Rclone sẽ quét và đưa ra các tùy chọn cho bạn trên Command Prompt:
  2. interactive: Hỏi bạn muốn giữ file nào cho từng trường hợp.
  3. first: Tự động giữ lại file đầu tiên tìm thấy và xóa các file sau.
  4. newest: Giữ lại file có thời gian chỉnh sửa mới nhất.
  5. oldest: Giữ lại file cũ nhất.

Cách 3: Sử dụng các Add-on/Ứng dụng chính thức trên Google Workspace Marketplace

Nếu việc chạy code hay gõ dòng lệnh quá phức tạp, bạn có thể sử dụng các tiện ích mở rộng được Google kiểm duyệt tích hợp thẳng vào tài khoản của bạn (không cần tải phần mềm về máy tính Windows/Mac).

Một trong những công cụ phổ biến và an toàn nhất là Filerev hoặc Organizer & Duplicate Remover for Google Drive™.

  • Bạn chỉ cần vào Google Workspace Marketplace, tìm tên các công cụ này rồi chọn cài đặt.
  • Các công cụ này chạy trực tiếp trên đám mây, tự động quét và phân loại các file trùng lặp chính xác 100% dựa trên byte dữ liệu, sau đó hiển thị danh sách cho bạn tick chọn xóa hàng loạt rất trực quan.

Tóm lại: Bạn không cần tải phần mềm bên thứ ba cài vào máy tính. Nếu bạn biết một chút về code, hãy dùng Cách 1 (Google Apps Script) để xử lý nhanh và hoàn toàn miễn phí; nếu muốn quét chuẩn xác bằng dòng lệnh theo nội dung file, hãy dùng Cách 2 (Rclone).

Để hiểu chi tiết hơn về cách thức hoạt động của các công cụ quét dọn tài khoản Drive tự động trên đám mây mà không cần cài phần mềm máy tính, bạn có thể tham khảo video hướng dẫn này.
Hướng dẫn tìm và xóa file trùng lặp trên Google Drive
Video này sẽ chỉ cho bạn từng bước cách sử dụng các công cụ dọn dẹp an toàn kết nối trực tiếp qua API của Google để quét và lọc bỏ các file trùng tên hoặc trùng nội dung một cách nhanh chóng.

Top comments (0)