Sử dụng Tệp PDF là một cách dễ dàng và an toàn để gửi và chia sẻ tài liệu. Khi bạn muốn giữ lại định dạng và thông tin chi tiết của bảng, bạn nên chuyển đổi tài liệu thành tệp PDF. Tuy nhiên, trích xuất các bảng từ một bảng là một công việc khá khó khăn nếu bạn đang nhận tệp PDF.




Trích xuất bảng từ hình ảnh tính năng pdf loading=

Tất nhiên, bạn muốn tiết kiệm thời gian và không muốn tạo một bảng mới từ đầu. Vì vậy, làm thế nào để bạn trích xuất bảng từ PDF mà không dựa vào sao chép và dán? Dưới đây là một số cách bạn có thể đạt được điều đó.

Sử dụng Trình chuyển đổi Trực tuyến

Cách nhanh nhất là sử dụng trình chuyển đổi tệp trực tuyến để thay đổi tệp PDF sang bất kỳ định dạng tài liệu nào khác mà bạn muốn. Một số công cụ trực tuyến miễn phí chuyển đổi PDF sang Excel để trích xuất dữ liệu dạng bảng. Các ví dụ phổ biến là cometdocs Smallpdf . Tuy nhiên, hầu hết các công cụ này chỉ cung cấp khả năng trích xuất cơ bản.

Tuyên bố từ chối trách nhiệm: Chúng tôi đặc biệt khuyên bạn nên tránh sử dụng trình chuyển đổi trực tuyến khi xử lý các tệp PDF thông tin nhạy cảm và bí mật tiếp tục.

Đây là cách trích xuất bảng từ tệp PDF bằng Smallpdf:




Trích xuất bảng từ pdf bước 1

Bước 2: Chọn chuyển đổi sẽ được thực hiện.




Trích xuất bảng từ pdf bước 2

Bước 3: Kéo tệp PDF cần chuyển đổi sang trình chuyển đổi PDF.




Trích xuất bảng từ pdf bước 3

Bước 4: Sau khi tải tệp lên xong, hãy nhấp vào Chuyển đổi sang Excel.




Trích xuất bảng từ pdf bước 4

Bước 5: Nhấp vào Tải xuống để lưu tệp PDF vào thiết bị của bạn.




Trích xuất bảng từ pdf bước 5

Bước 6: Khởi chạy excel đã tải xuống để xác nhận xem bảng của bạn đã được chuyển đổi chính xác chưa.




Trích xuất bảng từ pdf bước 6

Trích xuất bảng bằng Microsoft Power BI

Microsoft BI là một công cụ hữu ích khác để trích xuất dữ liệu bảng từ tệp PDF. Đặc biệt, tính năng Power Query trên Power BI giúp người dùng dễ dàng nhập tệp PDF và trích xuất dữ liệu bảng bên trong tài liệu.

Tuy nhiên, điều này chỉ hoạt động đối với những người có đăng ký Office 365. Ngoài ra, bạn sẽ phải mua gói Power BI riêng.

Tính năng Power Query cũng có sẵn trong bản dùng thử miễn phí Power BI. Dưới đây là cách sử dụng nó để trích xuất dữ liệu dạng bảng:




Trích xuất bảng từ pdf bước 7

Bước 2: Chọn Lấy dữ liệu trong phần Trang chủ của màn hình ứng dụng.




Trích xuất bảng từ pdf bước 8

Bước 3: Nhấp vào Tệp rồi chọn PDF.




Trích xuất bảng từ pdf bước 9

Bước 4: Nhấp vào Kết nối để duyệt qua vị trí của tệp PDF trên máy tính của bạn.




Trích xuất bảng từ pdf bước 10

Bước 5: Chọn vị trí của tệp PDF để nhập vào Power BI.




Trích xuất bảng từ pdf bước 11

Bước 6: Khi tệp đã được nhập vào Power BI, bạn sẽ thấy Bộ điều hướng với số bảng và số trang. Chọn Số bảng để tải.




Trích xuất bảng từ pdf bước 12

Bước 7: Chọn Load để tạo Bảng trên Power BI.




Extract tables from pdf step 24

Using Microsoft Excel

Microsoft Excel like Power BI has the Power Query feature which can be used to load PDF files and extract tabular data. However, this feature is only available on Excel 2016 or newer versions. Here’s how it works:

Step 1: Launch Microsoft Excel.




Extract tables from pdf step 18

Step 2: Select Data on the Ribbon.




Extract tables from pdf step 19

Step 3: Select Get Data to launch the dropdown.




Extract tables from pdf step 20

Step 4: Select From File and From PDF.




Extract tables from pdf step 21

Step 5: Select the location of the PDF file to import it into Excel.




Extract tables from pdf step 22

Step 6: Once the file has been imported into Excel, you should see a Navigator with table numbers, page numbers or a preview of the data within the PDF. Select the Table Number to be loaded.




Extract tables from pdf step 23

Step 7: Select Load to create the table on Excel.




Extract tables from pdf step 24

If you’re using Microsoft Office 2016 or a newer package and you observe that your data tab does not contain the Power Query feature. Here’s how to install it.

Step 1: Visit the Microsoft Website.

Step 2: Select the Language of the add-on.




Extract tables from pdf step 13

Step 3: Select Download.




Extract tables from pdf step 14

Step 4: Select the version of the add-in you want to download.




Extract tables from pdf step 15

Step 5: Select Next to commence download.




Extract tables from pdf step 16

Step 6: Once the file has completed download, Run the file to install the add-in.




Extract tables from pdf step 17

Using Adobe Acrobat Pro DC

Adobe Acrobat Pro DC is another tool that can be used to extract tabular data from PDF files or convert PDF files into other file types such as excel for data analysis. The tool has a 7-day trial version and a professional version and can be used online or downloaded to a device.

Adobe Acrobat Web Version

Here’s how to use the web version to extract tabular data:




Extract tables from pdf step 25

Step 3: Scroll down the website and locate PDF to Excel.




Extract tables from pdf step 26

Step 4: On the new pop-up menu, drag and drop the PDF file you want to convert.




Extract tables from pdf step 27

Step 5: Once the file is done uploading, select Export to XLSX.




Extract tables from pdf step 28

Step 6: Select the Download icon at the top of the page to save the converted file to your device.




Extract tables from pdf step 29

Adobe Acrobat on PC

Here’s how to use the PC version to extract tabular data:

Step 1: Launch the Adobe Acrobat Pro DC app.




Extract tables from pdf step 32

Step 2: On the app, select Open a File.




Extract tables from pdf step 30

Step 3: Using the file library select the PDF file to be imported to the app.




Extract tables from pdf step 31

Step 4: Once the file opens, use the cursor to highlight the table data.




Extract tables from pdf step 33

Step 5: Right-click on the highlighted area and select Export Selection As.




Extract tables from pdf step 34

Step 6: On the File Library input details of the File Name and select the File Type.




Extract tables from pdf step 35

Comparing Two PDF Files

Extracting tables from PDF files is not an impossible task. Using Power Query on Excel and Power BI, you can import other file types apart from PDF. On the other hand, using Adobe Acrobat Pro DC, you can compare two PDF files side by side.



Bài viết trên có thể chứa các liên kết liên kết giúp hỗ trợ Guiding Tech. Tuy nhiên, nó không ảnh hưởng đến tính toàn vẹn biên tập của chúng tôi. Nội dung vẫn không thiên vị và xác thực.

Categories: IT Info