タグ: Cloud Functions :4件
スクレイピングプログラムは様々な書籍やブログで紹介されており、勉強環境は非常に充実しています。一方でそのプログラムをどのように運用するかについては、情報量ははるかに少なくなります。この記事ではその1つの解としてGASとスプレッドシート、Cloud Functionsを使った自動実行システム構築の方法を解説しています。
Cloud Functionsでは昨年からnode.jsとpupeteerを使ってJavaScriptに対応したサイトをスクレイピングするためのヘッドレスブラザの利用が可能となりましたがこの記事ではpythonで主流のheadless Chromeとseleniumを使ったスクレイピング方法について記載しています。
Clud FunctionsのPythonはFlaskを利用しており、自動でFlaskやrequestsなどのパッケージがインストールされます。それ以外のパッケージはrequirements.txtを使ってインストールされます。ここではサードパーティパッケージや自作パッケージ、GASとの連携方法について説明しています。
Google Cloud FunctionsはAWS lambdaに相当するGoogle Cloud Platformの機能ですが、サーバレスアーキテクチャーの流れで今後注目されていくことが予想されます。この記事ではCloud Functionsのpythonの基本的な使い方について説明しています。