PDF files are popular because they support text, images, animations, videos, and various annotations. However, for many documents, the text is the most crucial part. This article explains how to convert PDF files to TXT files and, conversely, TXT files to PDF using C# .NET. This conversion is particularly useful when you need to extract or focus solely on the text content of a PDF document, such as when performing text analysis or preparing content for reformatting.
הנושאים המפורטים במדריך זה כוללים:
- C# TXT ל PDF או PDF ל TXT Converter API
- C# להמיר PDF ל- TXT ללא פורמט
- להמיר קובץ PDF ל- TXT באמצעות שיטות הצורה באמצעות C# או VB.NET
- להמיר קובץ TXT ל- PDF באמצעות C# או VB.NET
Tip: You might also be interested in a free תגית: GIF Converter that allows you to generate animated GIFs from text.
C# TXT ל- PDF או PDF ל- TXT Converter
Converting between PDF and TXT formats is essential when your main interest lies in the textual data within a document. Whether you need to strip out all formatting for simple text analysis or preserve some structured layout, the process can be accomplished with a few simple steps using the דפדפן PDF עבור .NET API. This API is versatile and supports both C# and VB.NET, making it easy to integrate into your .NET applications.
To install the API in your application, you can either download the DLL files from הורדות or use the נוגט gallery. For example, install it via the Package Manager Console:
PM> Install-Package Aspose.PDF
ברגע שה-API מותקן, אתה יכול להתחיל את תהליך ההמרה עם מספר גישות מותאמות לצרכים שונים.
C# להמיר PDF ל- TXT ללא הצורה
לפעמים, אתה רק צריך את הטקסט הירוק מסמך PDF ללא כל הצורה נוספת.שיטה זו מוציאה את הטקסט בדיוק כפי שהוא מופיע במסמך, ללא שמירה על טקסטים, שטח, או סגנונות.
צעד אחר צעד לחלץ טקסט ירוק
להורדה של מסמך PDF: השתמש ב- API כדי להעלות את קובץ PDF לתוך אובייקט מסמך.
התחלה של StringBuilder: Create an instance of the StringBuilder class to efficiently accumulate text data.
הצג דרך כל דף PDF: לחצו על כל הדפים של המסמך עבור כל דף:
Use TextDevice to extract text.
Employ the אופנה Raw to ensure that formatting is not applied.
שמור את טקסט היציאה: כתוב את הטקסט המצטבר לקובץ TXT.
הסריפט הקוד למטה מראה כיצד להמיר קובץ PDF לקובץ TXT באמצעות שיטת החילוץ Raw:
השקפות נוספות
- ביצועים ופשטות: מיצוי טקסט ירוק הוא בדרך כלל מהיר יותר כי הוא לא מנסה לחתוך או ליישם כללים של עיצוב.
- מקרים של שימוש: אידיאלי עבור רכישת יומנים, אינדקס חיפוש, או סקרינרים שבהם רק תוכן טקסט נדרש.
להמיר קובץ PDF ל- TXT באמצעות שיטות הצורה באמצעות C# או VB.NET
בסצנות אחרות, שמירה על הצורה של הטקסט (כגון פסוקים, תוויות, עמודים) היא חיונית.שיטה זו מתייחסת לצורה של שיטות כדי להדביק את הפריסה של המסמך בקובץ TXT התוצאה.
צעד אחר צעד ב- Text Extraction with Formatting
הורד את מקור הקובץ PDF: כמו בעבר, להעלות את המסמך PDF לתוך היישום שלך.
התחל עם משתנה קשת: להכין רצועה כדי לאסוף יצוא טקסט פורמט.
הצגת טקסט באמצעות מצב הפורמט: For each page, use the טופס טופס טופס option. This mode attempts to reproduce the original formatting as closely as possible.
שמור את הטקסט הפורמט: יצא את הטקסט שנאסף לתוך קובץ TXT שמחזיק בפורמט מובנה כגון פריצות שורה, פריצות, ופינוי שורות.
הדוגמה הבאה של קוד מראה כיצד להמיר קובץ PDF לקובץ TXT עם עיצוב טקסט באמצעות C#:
השוואה חזותית בין RAW ו- Pure Extraction
התמונה למטה מספקת השוואה חזותית בין שני מצבי החילוץ.לשמאל, הטקסט של PDF מופיע עם הצורה המקורית שלה (מצב טהור), בעוד שהצד הימני מראה טקסט ירוק ללא הצורה כלשהי.השוואה זו יכולה לעזור לך להחליט איזה שיטה מתאימה הכי טוב לצרכים שלך.

להמיר קובץ TXT ל- PDF באמצעות C# או VB.NET
ההמרה של קובץ TXT בחזרה ל- PDF היא שימושית כאשר אתה צריך לייצר מסמך מעודכן מתוך תוכן טקסט שטוח.תהליך זה כולל קריאת הטקסט ולאחר מכן יישום פורמט PDF כדי ליצור מסמך אשר הוא אטרקטיבי ויזואלי ומוכן לשיתוף.
שלבים עבור TXT ל- PDF Conversion
יצירת יישום של TextReader: Use the טקסטריידר class to read content from the TXT file.
התחל מסמך PDF חדש ולהוסיף דף לבן: Create an instance of the מסמך class and add a new page.
להגדיר אובייקט TextBuilder: Use the TextBuilder to construct text paragraphs with desired formatting, such as font, size, and color.
קרא ולהוסיף כל שורה של טקסט: לעבור את השורות בקובץ TXT, להוסיף כל שורה לאובייקט TextBuilder.
שמור את היציאה PDF: Use the ארכיון הכתבות על Save (String) method to write the final PDF file to disk.
הסריפט הקוד למטה מראה כיצד להמיר קובץ TXT לתוך מסמך PDF באמצעות C#:
שיקולים כאשר להמיר TXT ל- PDF
- סגנון וסגנון: ייתכן שתצטרך להתאים את הגבולות, שטח הקו ותכונות טקסט אחרות כדי להבטיח שה- PDF יהיה מעוצב היטב וקריא.
- טעות בניהול: יישום בדיקת שגיאות במהלך קריאת קבצים וכתוב פעולות כדי להתמודד עם סקרינרים כגון בעיות גישה לקבצים או קוד שגיאות.
מסקנה
In this article, we demonstrated the techniques for converting PDF files to TXT and TXT files to PDF using C# or VB.NET in the .NET Framework. Whether you opt for raw text extraction for speed and simplicity or require formatted text to retain document layout, the דפדפן PDF עבור .NET API offers reliable and flexible solutions. These conversion methods are invaluable for data processing, document archiving, and content repurposing.
If you have any questions or require further assistance, please visit our פורום תמיכה חינם or review the תיעוד המוצר.