jack 2 달 전
부모
커밋
0c4182bf2d
1개의 변경된 파일5개의 추가작업 그리고 5개의 파일을 삭제
  1. 5 5
      py/core/providers/ingestion/unstructured/base.py

+ 5 - 5
py/core/providers/ingestion/unstructured/base.py

@@ -103,11 +103,11 @@ class UnstructuredIngestionProvider(IngestionProvider):
 
     EXTRA_PARSERS = {
         DocumentType.CSV: {"advanced": parsers.CSVParserAdvanced},  # type: ignore
-        #DocumentType.PDF: {
-        #    "ocr": parsers.OCRPDFParser,  # type: ignore
-        #    "unstructured": parsers.VLMPDFParser,  # type: ignore
-        #    "zerox": parsers.VLMPDFParser,  # type: ignore
-        #},
+        DocumentType.PDF: {
+            "ocr": parsers.OCRPDFParser,  # type: ignore
+            "unstructured": parsers.PDFParserUnstructured,  # type: ignore
+            "zerox": parsers.VLMPDFParser,  # type: ignore
+        },
         DocumentType.XLSX: {"advanced": parsers.XLSXParserAdvanced},  # type: ignore
     }