Console Sistem ve Servis Programlama SQL ve XML Gibi DataSource Tipleri

Html Table to Txt

Html dosyasını parçalayıp excel veri kaynağında kullanılabilir bir txt dosyasına çevirmek için aşağıdaki kodlar işinizi görecektir.

var doc = new HtmlAgilityPack.HtmlDocument();
string okunan = File.ReadAllText(file);
doc.LoadHtml(okunan.Replace("\n", "").Replace("\r", " ").Replace(" ", " "));
var tables = doc.DocumentNode.Descendants("table");
var rows = tables.First().Descendants("tr")
             .Select(tr => tr.Descendants("td").Select(td => td.InnerText).ToList())
             .ToList();
string path = file.Replace("html", "txt");


int i = 0;
int rcnt = rows.Count;
using (StreamWriter sw = new StreamWriter(path))
{
    foreach (var row in rows)
    {
        string rowPart = "";
        foreach (string cell in row)
        {
             rowPart += cell + "\t";
        }
        sw.WriteLine(rowPart);
        i++;
        Console.Write("\r{0} Satır yazıldı - Toplam Satır Sayısı:{1}  ", i, rcnt);
    }
}

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir