Карта сайта Kansoftware
НОВОСТИУСЛУГИРЕШЕНИЯКОНТАКТЫ
Разработка программного обеспечения
KANSoftWare

Быстрая обработка файла

Delphi , Файловая система , Файлы

Быстрая обработка файла

Автор: Mike Scott

Хакеp пpиходит к специалистy по паpоноpмальным явлениям:
- Доктоp, помогите мне! У меня дома такое твоpиться! Диски по комнате летают, сами в компьютеp ставяться и Windows yстанавливают!
- У-y! Батенька, да y вас полтеpГейтс!


type
  TByteSet = set of byte;

procedure ProcessFile(const InFileName, OutFileName:
  string; Valid: TByteSet);
var
  InFile, OutFile: file;
  InBuf, OutBuf: PByteArray;
  InPos, OutPos: word;
  BytesRead: word;
begin
  OutBuf := nil;
  New(InBuf);
  try
    New(OutBuf);
    AssignFile(InFile, InFileName);
    AssignFile(OutFile, OutFileName);
    Reset(InFile, 1);
    Rewrite(OutFile, 1);
    repeat
      Blockread(InFile, InBuf^, SizeOf(InBuf^), BytesRead);
      OutPos := 0;
      for InPos := 0 to BytesRead - 1 do
      begin
        if InBuf^[InPos] in Valid then
        begin
          inc(OutPos);
        end;
      end;
      if OutPos > 0 then
        BlockWrite(OutFile, OutBuf^, OutPos);
    until BytesRead <> SizeOf(InBuf^);
    CloseFile(InFile);
    CloseFile(OutFile);
  finally
    if OutBuf <> nil then
      Dispose(OutBuf);
    Dispose(InBuf);
  end;
end;

Применять это можно приблизительно так:


ProcessFile( 'SOURCE.RAW', 'NEW.RAW', [ 10, 13, 32..255 ] ) ;

Программный код на Delphi, предназначенный для обработки файла, фильтрации нежелательных байтов и записи отфильтрованной данных в новый файл. Вот подробное описание того, что код делает:

  1. Определен тип TByteSet как множество байтов.
  2. Процедура ProcessFile принимает три параметра:
    • InFileName: имя входного файла
    • OutFileName: имя выходного файла
    • Valid: множество допустимых значений байта для включения в выходной файл
  3. Процедура открывает оба файла, читает входной файл блок за блоком и записывает отфильтрованную данные в выходной файл.
  4. Для каждого блока, прочитанного из входного файла, она перебирает байты и проверяет, есть ли они в множестве Valid. Если байт является допустимым, то инкрементирует счетчик (OutPos) количество найденных допустимых байтов.
  5. Если были найдены какие-либо допустимые байты, процедура записывает отфильтрованную данные в выходной файл с помощью BlockWrite.
  6. Процедура повторяет это процесс до тех пор, пока не будет прочитана вся информация из входного файла.

Пример использования в конце демонстрирует, как использовать эту процедуру:

ProcessFile('SOURCE.RAW', 'NEW.RAW', [10, 13, 32..255]);

Это фильтрует нежелательные байты (например, нули, табуляции и не печатаемые символы) из входного файла SOURCE.RAW и записывает отфильтрованную информацию в новый файл с именем NEW.RAW.

Некоторые возможные улучшения или альтернативные решения:

  • Вместо использования BlockRead и BlockWrite, рассмотрите использование процедур Read и Write с буферизацией, что может быть более эффективно.
  • Используйте более эффективный алгоритм фильтрации байтов, например, используя маску бит или таблицу поиска.
  • Добавьте обработку ошибок для ловли исключений, которые могут возникнуть при операциях с файлами.
  • Рассмотрите использование более robust способа указания допустимых значений байта, например, массивом байтов вместо множества.

В целом, код хорошо структурирован и легко понятен, но есть некоторые возможности для оптимизации и улучшения.

Данная статья описывает код на языке Pascal, который позволяет быстро обрабатывать файлы, удаляя из них нежелательные символы и сохраняя результат в новом файле.


Комментарии и вопросы


Ваше мнение или вопрос к статье в виде простого текста (Tag <a href=... Disabled). Все комментарии модерируются, модератор оставляет за собой право удалить непонравившейся ему комментарий.

заголовок

e-mail

Ваше имя

Сообщение

Введите код




Материалы статей собраны из открытых источников, владелец сайта не претендует на авторство. Там где авторство установить не удалось, материал подаётся без имени автора. В случае если Вы считаете, что Ваши права нарушены, пожалуйста, свяжитесь с владельцем сайта.



:: Главная :: Файлы ::


реклама



©KANSoftWare (разработка программного обеспечения, создание программ, создание интерактивных сайтов), 2007
Top.Mail.Ru

Время компиляции файла: 2024-06-02 10:20:12
2024-07-17 15:53:16/0.0078330039978027/2