VB.NETのWindowsアプリケーションから、指定したURLのHTMLを取得する方法について説明します。
指定したURLからHTMLを取得するには、WebClientクラスを利用します。
WebClientクラスのOpenReadメソッドは、ストリームとしてデータを取得します。
そのため、StreamReaderクラスを使って、文字列としてデータを取得することになります。
この時に取得する文字列がHTMLのソースコードになります。
以下、サンプルです。
【補足事項】
・指定するエンコードは、HTMLソース内のMETAタグに記載されています。
以下、サンプルです。
※通常は、1行で記載されています。
・VB.NETで利用できるエンコードの一覧は、以前の記事「【VB.NET】.NETで利用できるエンコード一覧を取得する」を参照して下さい。
指定したURLからHTMLを取得するには、WebClientクラスを利用します。
WebClientクラスのOpenReadメソッドは、ストリームとしてデータを取得します。
そのため、StreamReaderクラスを使って、文字列としてデータを取得することになります。
この時に取得する文字列がHTMLのソースコードになります。
以下、サンプルです。
Public Class SampleHTML
Public Shared Sub main()
Dim client As System.Net.WebClient = _
New System.Net.WebClient()
Dim url As String
url = "http://blog.livedoor.jp/akf0/"
'指定したURLからデータを取得する
Dim wkStream As System.IO.Stream = _
client.OpenRead(url)
'エンコード指定で文字列を取得する
'サイトによってエンコードは異なる
Dim sr As StreamReader = _
New StreamReader(wkStream, _
System.Text.Encoding.GetEncoding("euc-jp"))
Dim html As String = sr.ReadToEnd()
sr.Close()
wkStream.Close()
Debug.WriteLine(html)
End Sub
End Class
【補足事項】
・指定するエンコードは、HTMLソース内のMETAタグに記載されています。
以下、サンプルです。
<meta http-equiv="Content-Type"
content="text/html; charset=euc-jp" />
※通常は、1行で記載されています。
・VB.NETで利用できるエンコードの一覧は、以前の記事「【VB.NET】.NETで利用できるエンコード一覧を取得する」を参照して下さい。
- カテゴリ:
- VB.NET