Extract Text from PDF C#

PDF-tiedostoista tekstien poisto on yleinen vaatimus asiakirjojen käsittelyn tehtävissä.Tämä artikkeli tarjoaa syvällisen oppaan käyttämisestä Aspose.PDFin tekstiä poistaja Plugin tehokkaaseen ja monipuoliseen tekstipoistoon C#: ssä. Tarvitsetko tekstin poistaa koko dokumentista, tiettyjä sivuja tai määriteltyjä alueita, Aspose Plugiin helpottaa korkean suorituskyvyn PDF -tekstinäyttöä minimaalisella vaivalla.

Tärkeimmät ominaisuudet Aspose.PDF Text Extractor Plugin

Yleiskuva Aspose.PDF:n tekstiekstraktorin laajennuksesta

Aspose.PDF’s Text Extractor Plugin for .NET on kestävä ratkaisu PDF-tiedostojen tekstien poistoon. se on erityisesti suunniteltu kehittäjille, jotka työskentelevät .Net-sovellusten kanssa, tukemalla sekä .NET Framework että .net Core PDF -tekstinäytteitä varten.

  • Pure Mode: Tuottaa tekstiä säilyttäen alkuperäisen muotoilun ja rakenteen.
  • Raw Mode: Poistaa tekstin ilman muotoilua.
  • Plain Mode: Poistaa tekstin ja poistaa kaikki muotoilut ja erityiset merkit.

Hyötyjä käyttämällä Aspose.PDF

  • Batch Processing: käsittele useita PDF-tiedostoja samanaikaisesti.
  • Käsittelemättömät asetukset: Määritä kaivostoiminnot, jotka sopivat erityistarpeisiisi.
  • Seamless Integration: Integroidaan suoraan .NET-sovelluksiin sujuvan työnkulun varmistamiseksi.
  • High-Speed Performance: Optimoitu nopean, tarkkaan tekstin tuotantoon ja minimaaliseen resurssien kulutukseen.

Aloitetaan C# PDF-tekstitulostuksella

The ASPOSE.PDF ja .NET library is a comprehensive tool for .NET developers seeking high-performance C# PDF text extraction. You can easily install it via NuGet:

PM> Install-Package Aspose.PDF

Alternatively, you can Lataa DLL to integrate it directly into your project, providing a reliable C# PDF text extraction solution.

Tekstin poisto koko PDF:stä C#:ssä

Voit poistaa koko tekstin PDF:stä seuraamalla seuraavia vaiheita:

  • Load the PDF using the Dokumentti class.
  • Create a tekstiabsorbentti object.
  • Soveltaa absorbtori kaikkiin sivuihin.
  • Tallenna teksti tiedostoon.

Esimerkkinä koodi

Tekstin poisto tietyistä sivuista PDF: ssä

Voit poistaa tekstin yhdestä sivusta:

  • Lataa PDF.
  • Create a tekstiabsorbentti.
  • Soveltaa absorbtori halutulle sivulle.
  • Säilytä poistettu teksti.

Esimerkkinä koodi

Tekstin poisto tietyistä alueista PDF:ssä

Jos haluat poistaa tekstin tietyistä sivun alueista, määritä rektangulaariset koordinaatit.

Esimerkkinä koodi

Tekstin etsiminen ja poisto käyttäen Regex

Voit poistaa tekstiä, joka vastaa tiettyä mallia käyttämällä säännöllisiä ilmaisuja:

  • Lataa PDF.
  • Määritä regex malli.
  • Apply the pattern using tekstiabsorbentti.
  • Poista vastaavat tekstin kappaleet.

Esimerkkinä koodi

Taulukon tiedot tekstinä C#

Sisällön poistaminen taulukoista:

  • Lataa PDF.
  • Use pöytäkäyttö to navigate through table structures.
  • Poista teksti solun solun mukaan.

Esimerkkinä koodi

Korostettu teksti PDF:ssä

Valitse korostettu teksti:

  • Ilmoittautuminen kirjoitusten kautta.
  • Filter TextMarkupMuokkaa.
  • Korjaa ja tallentaa korostetut kappaleet.

Esimerkkinä koodi

Optimoi tekstien poistoa alhaisen muistin käytön kanssa

i) Using **** and ****:

  • Call absorber.Reset() after processing each page.
  • Free memory held by pages using page.FreeMemory().

ii) Using muistiinpano Mode:

Set TextExtractionOptions.TextFormattingMode to optimize memory usage during PDF text extraction.

Esimerkkinä koodi

Ilmainen C# PDF Text Extraction Library

Get a Ilmainen väliaikainen lisenssi for unrestricted access to Aspose.PDF for .NET and unlock its full potential for efficient C# PDF text extraction.

johtopäätöksiä

Aspose.PDF’s Text Extractor Plugin for .NET tarjoaa monipuolisen ja tehokkaan ratkaisun luotettaville tekstinlähtötehtäviin. tekstiä koko asiakirjasta tiettyihin sivuihin tai alueisiin, se nopeuttaa prosessia tarkkuudella ja nopeudella. Tämä tekee siitä yhden parhaista C# PDF-tekstinähtäkirjoista käytettävissä. Kokeile sitä tänään yksinkertaistamaan PDF: n tekstienlähdön työnkulkua vain $99!

More in this category