Skip to main content

POST /api/pdf/extract

Trích xuất nội dung text từ file PDF upload hoặc URL.

Request

file
File
required
File PDF cần trích xuất (multipart/form-data). Tối đa 20MB.
url
string
URL đến file PDF (thay thế cho upload trực tiếp).

Response

success
boolean
Trạng thái xử lý.
text
string
Nội dung text đã trích xuất. Giới hạn 50,000 ký tự.
title
string
Tiêu đề paper (từ metadata hoặc dòng đầu tiên).
pages
number
Số trang PDF.
wordCount
number
Số từ trong văn bản.

Example

// Response
{
  "success": true,
  "text": "Background: This systematic review examines...",
  "title": "Efficacy of Metformin in Type 2 Diabetes",
  "pages": 12,
  "wordCount": 8450
}