C# web sitesindeki (html) sitedeki verileri çekme

C# ile bir web sitesinin html kodlarına göre verileri çekebiliriz. Mesele sıralı listelenmiş verileri html kaynağına kendi veritabanımıza ekleyebiliriz. Bir nevi bot yapımı gibi düşünebilirsiniz. Sizin teker teker uğraşmanız yerine sistemin kendisinin otomatik yapması demektir. Bunun bir prjonizde bile kullanabilirsiniz.

Web sitesini düşünebilim HTML kaynak kodunu çekip richTextBox1.Text'inde gösterelim
Web sitesinde BURADAKİ DEĞER etiketleri içinde olan değerleri arayıp bulduralım.

 string veri = richTextBox1.Text;
            veri = veri.Replace("\"", "");
            Match rgex = Regex.Match(veri, @"(.*?)");
            while (rgex.Success)
            {
                richTextBox2.Text += rgex.Groups[1].Value.ToString();
                rgex = rgex.NextMatch();
            } 

İşleyişi....
Yukarıdaki kodu çalıştırdığımızda richTextBox1.Text'indeki verileri önce süzerek (") etiketlerini kaldırıyoruz. (.*?) diye aratıyoruz. (.*?)  herhangi değer anlamına geliyor.
Son olarak elimize geçen değerleri richTextBox2.Text'ine yazdırıyoruz.

2 yorum:

  1. istediğimiz kısmın html kodunu nasıl çekebiliriz,satır olarak vb

    YanıtlaSil
  2. regex fonksiyonları ile çektiğiniz html veriyi süzeceksiniz. Yani sadece sitediğiniz alanı elde etmiş olacaksınız.

    YanıtlaSil