Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Hex, Hex

Von Hex-Editoren und der Aufdeckung verborgener Bilder in Word-Dateien.
Es liegt in der Natur des Redakteurs, sich mit Texten auseinanderzusetzen: Der Redakteur redigiert, bereitet also Texte sprachlich und inhaltlich auf, damit sie gut zu lesen sind und in einer Zeitung, Zeitschrift oder online erscheinen können. Das bedeutet wiederum, dass Texte aus unterschiedlichen Quellen in verschiedensten Formaten auf den Redakteur einprasseln. Und das ist auch gut so. Die Autoren sollen sich komplett um den Inhalt eines Textes kümmern. Freilich kann ein Redakteur keine Wunder vollbringen: Aus einem schlechten Text wird nie ein wirklich guter.Doch der Mensch informiert sich nicht nur durch Text allein. Als Eyecatcher kommt Bildern eine wichtige Aufgabe zu. Aber auch zur Illustration sind Bilder unverzichtbar: Für Menschen als visuelles Wesen erschließen sich manche Zusammenhänge über ein Bild oft viel schneller.Langer Rede kurzer Sinn: Von Autoren kommen Word-Dokumente mit eingebauten Bildern, und diese sollen aus dem Dokument extrahiert werden, damit sie dem Publishing-System zugeführt werden können. DOCX ist ja nun ein ZIP-Archiv, in dem verschiedene Dateien verpackt sind – unter anderem auch die Bilder im Ordner word/media.Will man nun die Bilder herausholen, lässt sich das Dokument in ein ZIP-Programm laden und damit die Bilder extrahieren. Oder Sie verwenden SharpCompress [1]. Diese .NET-Bibliothek packt und verpackt Dateien in Archive der Formate Zip, Tar, Tar.GZip, TarBZip2, Tar.LZip und GZip. Damit aber nicht genug, kann sie Rar-, 7Zip- und Tar.XZ-Archive dekomprimieren. Mit der Bibliothek haben Sie also eine gut gefüllte Werkzeugkiste für komprimierte Archive.Lange Rede noch kürzerer Sinn: Mit dem folgenden Code holen Sie alle Bilder aus einem Word-Dokument heraus und speichern sie im selben Verzeichnis. Dazu fügen Sie das Paket SharpCompress per NuGet dem Projekt hinzu.
using SharpCompress.Archives;
using SharpCompress.Common;
using System;
using System.Linq;
namespace WordImages
{
 class Program
 {
  static void Main(string[] args)
  {
  using (var archive = SharpCompress.Archives.Zip
    .ZipArchive.Open("WordDocument.docx"))
  {
    foreach (var entry in archive.Entries
    .Where(entry => !entry.IsDirectory)
    .Where(entry => entry.Key.StartsWith(
      "word/media/")))
    {
    Console.WriteLine(entry.Key);
    entry.WriteToDirectory(".", new ExtractionOptions()
    {
      ExtractFullPath = false,
      Overwrite = true
    });
    }
  }
  }
 }
} 
[1] SharpCompress, www.dotnetpro.de/SL2110Downloads1

Schwerpunkt Hex-Editoren

<b>HxD</b><br/>HxD ist ein sorgfältig gestalteter und schneller Hex-Editor der neben dem direkten Bearbeiten von Datenträgern und dem Verändern des Arbeitsspeichers (RAM) auch Dateien beliebiger Größe verarbeiten kann. Die leicht zu bedienende Oberfläche bietet Funktionen wie Suchen und Ersetzen, Export in verschiedene Dateiformate, Prüfsummen/Digests, Einfügen von Byte-Mustern, einen Datei-Reißwolf, Zusammenfügen oder Aufspalten von Dateien, Statistiken und vieles mehr.<br/><a href="https://mh-nexus.de/de/hxd/" rel="noopener" target="_blank">

Buildalyzer

<b>NGitLab</b><br/>NGitLab ist eine .NET-REST-Client-Implementierung des GitLab-API ohne externe Abhängigkeiten.<br/><a href="https://github.com/ubisoft/NGitLab" rel="noopener" target="_blank">

Neueste Beiträge

Hierarchische Testdata-Builder - Testdata-Builder, Teil 1
Lesbare Tests bei tiefen Objekthierarchien mit dem Collection-Builder-Pattern.
4 Minuten
Chunks mit Köpfchen - KI für KMU, Teil 1
Wie trenne ich Textinformationen in sinnvolle Segmente?
7 Minuten
DDC hakt nach: Hör auf, Dich über Verbindungsstrings zu ärgern
Die App läuft lokal wie geschmiert, aber sobald Backend-Services ins Spiel kommen, stottert die Maschine. Connection Strings, die nicht wollen. Emulator-Konfigurationen, die nerven. Johan Smarius erklärt im Interview und auf der .NET Developer Conference 2025, wie es anders - und viel besser geht.
4 Minuten
10. Nov 2025
Miscellaneous

Das könnte Dich auch interessieren

Wexflow: .NET Open Source Workflow-Engine - CodeProject
Wexflow ist eine quelloffene und plattformübergreifende Workflow-Engine und Automatisierungsplattform, die darauf abzielt, wiederkehrende Aufgaben zu automatisieren.
2 Minuten
C#-.NET-Apps mit WinUI 3 - Komponentenbasierte Apps mit Fluent/FAST, Teil 3
Microsoft macht mit WinUI 3 ein natives User-Experience-Framework für Windows verfügbar, dessen Komponenten auf dem Microsoft-eigenen Design-System Fluent 2 basieren.
23 Minuten
13. Mai 2024
Das Model Context Protocol (MCP) mit C# verwenden - Kommunikation mit der KI
Mit dem neuen MCP C# SDK können Entwickler die Kommunikation zwischen KI-Modellen und Anwendungen effizient gestalten. Ein Blogpost bietet eine Schritt-für-Schritt-Anleitung zur Implementierung eines MCP-Servers.
3 Minuten
10. Apr 2025
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige