
Microsoft Wordin asiakirjat ovat rakennus ja tekstin jakaminen. Jos kehität C#-sovelluksia, jotka vuorovaikutuksessa näiden asiakirjojen kanssa, saatat löytää itsellesi tarvetta poistaa teksti niistä. Tämä voi olla tarkoituksiin, kuten tekstianalyysin tai poistaa tiettyjä osia asiakirjan koota uudeksi. Tässä blogin postissa, syöksymme menetelmiä poistaa teksti Wordin asiakirjoista C#.
Sisällön taulukko
- C# Kirjasto tekstien poistoon
- Ymmärtää tekstiä Word-asiakirjoissa
- Vaiheittainen opas tekstien poistoon Word-asiakirjasta- Artikkelien välinen teksti
- Tekstin erottaminen eri tyypien välillä
- Teksti, joka perustuu tyyliin
C# Kirjasto tekstien tuottamiseen {# Kirjasto tekstien tuottamiseen-Word-Documents}
Aspose.Words for .NET on tehokas ja käyttäjäystävällinen kirjasto, joka on suunniteltu työskentelemään Word-asiakirjojen kanssa. se tarjoaa kattavan joukon ominaisuuksia, mukaan lukien tekstin poisto, asiakirjan luominen, manipulointi ja muuntaminen. Aspose.Words for .NET, kehittäjät voivat tehokkaasti hallita erilaisia näkökohtia Word dokumentteja, mikä tekee siitä arvokasta työkalua kehitysvaatimuksillesi.
Jotta aloitetaan, Lataa kirjasto tai asennetaan suoraan NuGet Käytä seuraavaa komentoa paketinhallintakonsolissa:
PM> Install-Package Aspose.Words
Ymmärrä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä tekstiä
MS Word-asiakirja sisältää erilaisia elementtejä, kuten kappaleita, taulukoita ja kuvia. Näin ollen tekstien poisto vaatimukset voivat vaihdella tietyn käyttötapahtuman perusteella. Sinun saattaa olla tarpeen poistaa tekstiä kappaleiden, kirjoitusmerkkien, kommenttien ja enemmän.
Jokainen elementti Word-asiakirjassa esitetään ytimenä.Jos haluat tehokkaasti käsitellä asiakirjaa, sinun täytyy työskennellä näiden ytimien kanssa.Katsotaan, miten tekstiä Word-asiakirjoista voidaan poistaa eri skenaarioissa.
Vaiheittainen opas tekstien poistoon Word-asiakirjasta
Tässä osassa toteutamme Word-asiakirjojen C#-tekstinäytteen. tekstinäytteen työnkulku sisältää seuraavat vaiheet:
- Määritä yhdisteet, jotka on sisällytettävä kaivamisprosessiin.
- Poista sisältö määriteltyjen ytimien välillä (mukaan lukien tai sulkemalla pois aloitus- ja päättymisväylät).
- Käytä klonoituja poistuja luoda uusi Word-asiakirja, joka sisältää poistu sisältö.
Luomme menetelmän nimeltä ExtractContent, joka hyväksyy yrttejä ja muita parametreja tekstinäytteen suorittamiseksi.Tämä menetelmä hajottaa asiakirjan ja klonoi näiden parametrien perusteella:
StartNode ja EndNoda: Nämä määrittelevät sisällön tuottamisen lähtö- ja päättymiskohdat. Ne voivat olla lohko-taso (esim. Paketti, Tabeli) tai inline- taso nodeja ( Esimerkiksi Run , FieldStarta tai BookmarkStarti).- Valitse kentät ja siirry vastaava FieldStart -objekti.
Kirjamerkkejä varten käytä BookmarkStart ja BookmarkEnd -yhtyeitä.
Huomautuksia varten käytä CommentRangeStart ja Komment RangeEnd -yhdisteitä.
IsInclusive: Tämä parametri määrittää, sisällytetäänkö merkintöjä ulosteeseen.Jos asetetaan vääriin ja samat tai peräkkäiset kulmat annetaan, tyhjä luettelo palautetaan.
Tässä on ExtractContent -menetelmän täydellinen täytäntöönpano sisällön poistoon määritettyjen sarakkeiden välillä:
Lisäksi ExtractContent -menetelmä vaatii joitakin avustavia menetelmiä tekstin kaivamisen helpottamiseksi:
Nyt kun menetelmämme ovat valmiita, voimme jatkaa tekstien poistoa Word-asiakirjasta.
Tekstin poisto sanakirjan kappaleiden välillä {#Teksti poisto kappaleiden välillä}
Voit poistaa sisällön kahden kappaleen välillä Word DOCX-asiakirjassa, noudata seuraavia vaiheita:
- Lataa Word-asiakirja käyttämällä Document -luokkaa.
- Hanki viittauksia alku- ja päättymiskirjeisiin käyttämällä Document.FirstSection.Body.GetChild(NodeType.PARAGRAPH, int, boolean) -menetelmää.
- Valitse ExtractContent (startPara, endPara ja True) -menetelmä, jotta voiteet voidaan poistaa kohteeseen.
- Käytä GenerateDocument(Dokument, extractedNodes) -menetelmää, joka auttaa luomaan asiakirjan, jossa on tuotettu sisältö.
- Tallenna uusi asiakirja käyttämällä Document.Save(string) -menetelmää.
Tässä on koodin malli, joka osoittaa, miten tekstiä 7 ja 11 kappaleen välillä voi poistaa Word-asiakirjassa:
Tekstin poisto eri tyyppien välillä
Voit myös poistaa sisällön eri tyyppisten solmujen välillä. Esimerkiksi poista sisältö kappaleen ja taulukon välillä ja tallenna se uuteen Word-asiakirjaan.
- Lataa Word-asiakirja käyttämällä Document -luokkaa.
- Hanki viittauksia aloitus- ja loppukutsiin käyttämällä Document.FirstSection.Body.GetChild(NodeType, int, boolean) -menetelmää.
- Valitse ExtractContent(startPara, end Para, True) poistaa yrtit kohteeseen.
- Käytä GenerateDocument(Dokument, extractedNodes) -menetelmää, joka auttaa luomaan asiakirjan, jossa on tuotettu sisältö.
- Tallenna uusi asiakirja käyttämällä Document.Save(string).
Tässä on koodin malli tekstien poistoa kohdan ja taulukon välillä C#: ssä:
Teksti, joka perustuu tyyliin {#Teksti, joka perustuu kappaleisiin-tyyliin}
Voit poistaa sisältöä kappaleiden välillä tyyleihin perustuen, noudata näitä vaiheita.Tämän näytön osalta voimme poistaa sisältöä ensimmäisen “Kirjan 1” ja ensimmäisen “Kirjan 3” välillä Word-asiakirjassa:
- Lataa Word-asiakirja käyttämällä Document -luokkaa.
- Poista kappaleet kohteeseen käyttämällä apun menetelmää ParagraphsByStyleName(Document, “Heading 1”).
- Poista kappaleet toiseen kohteeseen käyttämällä ParagraphsByStyleName(Dokumentti, “Heading.
- Soita ExtractContent(startPara, endPara ja True) molemmista kappaleista peräisin olevien elementtien kanssa.
- Käytä GenerateDocument(Dokument, extractedNodes) -menetelmää, joka auttaa luomaan asiakirjan, jossa on tuotettu sisältö.
- Tallenna uusi asiakirja käyttämällä Document.Save(string).
Tässä on koodin malli, joka poistaa sisältöä kappaleiden välillä tyylien perusteella:
Lue lisää aiheesta Text Extraction
Tutki lisää skenaarioita tekstien poistamiseksi Word-asiakirjoista Tämä dokumentti artikkeli.
Saa ilmainen Word-tekstinäytön kirjasto
Voit saada A Ilmainen väliaikainen lisenssi tekstiä ilman arviointirajoituksia.
johtopäätöksiä
Aspose.Words for .NET on monipuolinen kirjasto, joka yksinkertaistaa tekstien poistoa Word-asiakirjoista C#: ssä. Sen laajan ominaisuuden ja käyttäjäystävällisen API: n avulla voit tehokkaasti työskennellä Word-asiakirjojen kanssa ja automatisoida erilaisia tekstien poiston skenaarioita. Olitpa kehittänyt sovelluksia, jotka vaativat Word-asiakirjan käsittelyä tai yksinkertaisesti tekstien poistoa, Aspose.Words for .NET on tärkeä työkalu kehittäjille.
Jos haluat tutustua lisää Aspose.Words ominaisuuksia .NET, tarkista Dokumentti. Jos sinulla on kysymyksiä, ole vapaa pääsemään ulos meidän kautta foorumi.
Katso myös
Tyyppi: Saatat haluta tarkistaa Aspose PowerPoint sanoihin Muunnin, joka osoittaa suositun prosessin muuntaa esityksiä Word-asiakirjoihin.
More in this category
- Vaihda Word DOC/DOCX PDF:ään C# .NET Aspose.Words' Document Converter Plugin
- Tuot Barcode Wordin asiakirjoissa (.NET, C#) ja Lue Barcode Wordista (.NET)
- Vähennä kuvia Word-asiakirjoista C#:n automaattisessa kuvankäsittelyssä
- Automaattiset raportoinnit C# Mailin kanssa Sekoita Aspose.Words' Mail Sekoita Plugin
- Löydä ja korvaa teksti Word-asiakirjoissa käyttämällä C#-automaattista Word-muokkausta