Net Frameworkには、複数のインターネット上のWebページから情報を取得するクラスが、存在しています。これらのクラスを使用すると、インターネット上のWebページから情報を取得するプログラムを作成することができます。
WebClientクラス
通常、Webサイトは、htmlとcssで表現されています。cssは、文字の色や大きさなどのスタイル情報を表現するために使用されています。そのため、Webサイトの情報は、htmlコードの中にあります。 そして、このhtmlコードはテキストファイルなので、このテキストファイルを適切に扱うことができれば、自分で作成するC#のアプリケーションに、インターネット上の情報を取り込むことができます。
C#プログラムで、WebサーバーとのHttp通信を行う方法は、いくつか存在します。 WebClientクラスを使用して、Webサーバー上のWebページのソースコードを取得したり、Webサーバーが公開しているAPIを呼び出すことが可能になります。
C#で作成したプログラム内のUIにWebページを表示する
C#では、WebサーバーとのHttp通信を行い、Webサーバー上のWebページのソースコードを取得したり、Webサーバーが公開しているAPIを呼び出すだけでなく、FormやWPFで作成したUIに、ブラウザ機能を実装する方法が用意されています。
C# のWPFアプリケーションで、インターネット上のhtmlファイルを読み込んで、必要な情報だけを取得する。
C# のWPFアプリケーションで、htmlテキストを読み込み、それを正規表現を使って抽出するプログラムの基本的な部分を作成してみたいと思います。
正規表現で、部分文字列を取得するC#のWPFアプリケーションを作成する
正規表現を使って、その前後の文字列のパターンによって囲まれた文字列を取得することは、部分文字列を取得することで実現できます。
C#で、相対uriと絶対uriを相互変換する
基準URIと相対URIを入力して、「絶対URIを取得」ボタンを押すと絶対URIが得られます。基準URIと絶対URIを入力してい「相対URIを取得」ボタンを押すと相対URIが得られます。
インターネットから取得したhtmlファイルから、リンクを抽出し、絶対uriに変換し、一覧にするプログラム
インターネット上のhtmlファイルを取得しaタグ内のuriを絶対uriに変換し一覧にします。