Карта сайта Kansoftware
НОВОСТИУСЛУГИРЕШЕНИЯКОНТАКТЫ
Разработка программного обеспечения
KANSoftWare

Удаление из файла элементов HTML

Delphi , Синтаксис , Текст и Строки

Удаление из файла элементов HTML


 

Как-то раз пришлось решить задачу удаления из файла элементов HTML таких, как, например, ненужные ссылки, и в то же время преобразования возврата каретки в HTML параграфы, знаков табуляции в пробелы и т.д. В результате соответственно должен был получиться новый HTML документ.

Следующие две процедуры показывают, как это можно сделать:


procedure TMainForm.LoadFileIntoList(TextFileName: string;
          AWebPage: TStringList; WithFilter: Boolean);
var
  CurrentFile: TStringList;
begin
  CurrentFile := TStringList.Create;
  CurrentFile.LoadFromFile(TextFileName);
  if WithFilter then
    FilterHTML(CurrentFile,AWebPage)
  else
    with AWebPage do
      AddStrings(CurrentFile);
  CurrentFile.Free;
end;

procedure TMainForm.FilterHTML(FilterInput, AWebPage: TStringList);
var
  i, j: LongInt;
  S: string;
begin
  FilterMemo.Lines.Clear;
  FilterMemo.Lines := FilterInput;

  with AWebPage do
  begin
    FilterMemo.SelectAll;
    j := FilterMemo.SelLength;

    if j > 0 then
    begin
      i := 0;
      repeat
        // ищем cr
        if FilterMemo.Lines.GetText[i] = Char(VK_RETURN) then
          S := S + #10#13;
        else
        if FilterMemo.Lines.GetText[i] = '<' then
          repeat
            inc(i);
          until
            FilterMemo.Lines.GetText[i] = '>'
        else
          // ищем tab
          if FilterMemo.Lines.GetText[i] = Char(VK_TAB) then
            S := S + ' '
          else
            S := S + FilterMemo.Lines.GetText[i]; // добавляем текст
        inc(i);
      until
        i = j + 1;
      Add(S); // добавляем строку в WebPage
    end
    else
      Add('No data entered into field.'); // no data in text file
  end;
end;

 

Применение функции:

Всё, что нужно сделать - это вызвать :


LoadFileIntoList("filename.txt",Webpage, True); 

 

Где:

filename
это имя файла, который вы хотите обработать.
WebPage
это TStringList
последний параметр в функции
указывает, применять или нет HTML-фильтр.

PS: В этом примере объект TMemo (который вызывается из "FilterMemo") лежит на форме и поэтому не видим.

Пример:


WebPage := TStringList.Create;
try
  Screen.Cursor := crHourGlass;
  AddHeader(WebPage);
  with WebPage do
  begin
    Add('Personal Details');
    LoadFileIntoList("filename.txt", Webpage, True);
  end;
  AddFooter(WebPage);
finally
  WebPage.SaveToFile(HTMLFileName);
  WebPage.Free;
  Screen.Cursor := crDefault;
end;

Статья Удаление из файла элементов HTML раздела Синтаксис Текст и Строки может быть полезна для разработчиков на Delphi и FreePascal.


Комментарии и вопросы


Ваше мнение или вопрос к статье в виде простого текста (Tag <a href=... Disabled). Все комментарии модерируются, модератор оставляет за собой право удалить непонравившейся ему комментарий.

заголовок

e-mail

Ваше имя

Сообщение

Введите код




Материалы статей собраны из открытых источников, владелец сайта не претендует на авторство. Там где авторство установить не удалось, материал подаётся без имени автора. В случае если Вы считаете, что Ваши права нарушены, пожалуйста, свяжитесь с владельцем сайта.



:: Главная :: Текст и Строки ::


реклама



©KANSoftWare (разработка программного обеспечения, создание программ, создание интерактивных сайтов), 2007
Top.Mail.Ru Rambler's Top100
19.04.2024 14:07:06/0.033584833145142/0