インフラ・サーバー運用

【参加レポート】4/10開催のAWSセミナーに参加しました！

こんにちは。22年度入社の中島です。

今回は、4月10日に行われたAWSのオンラインセミナー（AWSome Day Online Conference）に参加しました。AWSの資格取得を考えていた私にとって、AWS の基礎やクラウドの全体像を学べる非常に貴重な機会となりました。今回は、セミナーがどのような内容だったか紹介したいと思います。

AWSの概要

セミナーの冒頭では、AWSとは何かという基礎的な部分から始まりました。
AWSは、Amazonが提供するクラウドサービスで、世界中で数百万以上のユーザーに利用されているとのこと。サービスの種類は200以上あり、Webアプリケーションのホスティングから機械学習、ビッグデータ分析まで、あらゆるニーズに対応しています。

クラウドの大きなメリットは、従来のように物理サーバーを購入・構築する必要がなく、必要なときに必要なリソースをすぐに使い始められるという「オンデマンド性」と「スケーラビリティ」です。導入コストや運用コストを抑えつつ、ビジネスのスピード感にも対応できる点が、クラウドが選ばれる理由だと感じました。

セミナーでは、続いて各サービスについての説明がありました。

ストレージ

AWSには多様なストレージサービスがありますが、主なものは、以下の3つ。

Amazon S3（Simple Storage Service）：
オブジェクトストレージの代表格で、耐久性99.999999999%（イレブンナイン）を誇ります。ログの保存、画像・動画の保存、バックアップ用途など、多様な使い方が可能です。
Amazon EBS（Elastic Block Store）：
EC2のインスタンスに接続して使うブロックストレージ。高性能なI/Oが必要なワークロードに最適です。
Amazon EFS（Elastic File System）：
複数のインスタンスで共有できるネットワークファイルシステム。Linuxベースのアプリケーションでよく使われます。

データベース

マネージドサービスとして提供されるAmazon RDSでは、MySQL、PostgreSQL、Oracle、SQL Serverなど複数のDBエンジンがサポートされています。バックアップやパッチ適用などの運用作業を自動化することができ、便利な機能がたくさんありました。

また、NoSQL型のAmazon DynamoDBも紹介され、レスポンスタイムが非常に高速で、柔軟なスケーリングが可能な点が魅力だと感じました。リアルタイムに大量なデータを扱わないといけない場合に活用したいと思いました。

ネットワークとセキュリティ

AWS上のネットワーク設計には、VPC（Virtual Private Cloud）という概念があります。これは自分専用の仮想ネットワークを構築するようなもので、プライベート／パブリックサブネットの設計や、ルーティング、NATゲートウェイなど、細かなネットワーク設計が可能です。

セキュリティ面では、IAM（Identity and Access Management）が重要な役割を担っており、ユーザーやロールごとに細かな権限設定が行えます。また、ファイアウォールのような役割を持つセキュリティグループや、アクセスを制限するネットワークACLの存在も紹介されました。

特に印象に残ったのが、「セキュリティはAWSとユーザーで責任を分担する」という責任共有モデルです。AWSはインフラのセキュリティを提供し、ユーザーはOS・ミドルウェア・アプリケーションレベルでのセキュリティ対策を行う必要がある、という考え方は、今後のクラウド設計において必須の知識だと感じました。

AWSのAIサービスについて

セミナーでは、AWSが提供するAIサービス群についても紹介されましたが、ここではその中でも特に注目したいサービスをいくつか掘り下げてご紹介します。

Amazon Rekognition（画像・動画解析）

Amazon Rekognition は、画像や動画の中に含まれる情報を高精度で分析できるサービスです。使い方はとてもシンプルで、画像や動画をアップロードし、API経由で解析を依頼するだけで行うことができます。セミナーでは、以下のような機能の紹介がありました。

オブジェクトとシーンの検出：
画像内に写っている「人」「自動車」「建物」「屋内」「屋外」など、さまざまなオブジェクトやシーンを自動で検出できます。
例えば、防犯カメラの映像から不審な動きを検知したり、メディア業界でタグ付けを自動化したりといった使い方が可能です。
顔分析と顔認識：
顔の位置、表情（喜び・怒り・驚きなど）、年齢の推定、性別などの顔の特徴を詳細に分析できます。また、顔認証のように同一人物かどうかの比較も可能です。
これにより、出入管理システムや顧客体験のパーソナライズにも活用が期待できます。

Amazon Comprehend（自然言語処理）

Amazon Comprehendは、自然言語処理（NLP）に特化したサービスで、テキストデータから感情分析やキーフレーズの抽出、言語の判定などを行うことができます。

例：カスタマーサポートのチャットログから、顧客が「満足している」「怒っている」といった感情を分析することができ、対応の改善につながります。

Amazon Polly（テキスト読み上げ）

Amazon Pollyは、テキストを自然な音声で読み上げるTTS（Text-to-Speech）サービスです。

文章を入力すると、40以上の言語・70以上の音声で発音してくれるため、ナレーションの自動生成や、読み上げ機能のあるアプリに最適です。

Amazon SageMaker（機械学習モデルの構築・運用）

Amazon SageMakerは、より本格的に機械学習モデルを開発したい人向けのフルマネージドサービスです。

データの準備からトレーニング、デプロイまでを一括で行うことができ、Jupyter Notebookも統合されており、手軽に始められます。

これらのAIサービスの強みは、高度な技術をAPI一つで使える手軽さにあります。機械学習や画像処理といった分野に敷居の高さを感じていた人でも、AWSを使えばすぐに試せる環境が整っているのはとても心強いと感じました。

AWSの無料利用枠について

そして、何よりAWSには、初心者が気軽に始められるよう「無料利用枠（Free Tier）」が用意されています。これはAWSの多くのサービスを一定期間・一定の条件下で無料で試すことができる仕組みです。

【無料利用枠の種類】

12か月間無料
アカウント作成から12か月間、以下のような代表的なサービスを無料で使えます。

Amazon EC2：Linux/Windowsインスタンスを月750時間（t2.microまたはt3.micro）まで無料
Amazon S3：月5GBまでのストレージ使用が無料
Amazon RDS：MySQL、PostgreSQLなどのデータベースが月750時間無料

常時無料（Always Free）
一部のサービスは期間に関係なく無料枠が継続して利用できます。

AWS Lambda：月100万リクエスト、40万GB-秒まで無料
Amazon DynamoDB：25GBのストレージ、毎月25ユニットの読み書きキャパシティが無料
Amazon CloudWatch：基本的なモニタリング機能を無料で使用可能

トライアルベースの無料枠
特定のサービスに限り、試用期間中に無料で利用できる枠が提供される場合があります。

【活用時の注意点】

・AWS公式の「コストエクスプローラー」や「料金アラート」を使えば、使いすぎを事前に防ぐことができます。

・料金発生を防ぐためにも、利用量のモニタリングや無料枠超過のアラート設定は忘れずに行うことが大切です。

これまでのインフラとこれからのインフラ

セミナーを通して一番印象に残ったのは、「インフラ基盤の在り方が根本から変わっている」ということ。

これまでのインフラ：
　物理サーバーを自社で購入・設置・運用。時間もコストもかかる。拡張も大変。
これからのインフラ：
　クラウド上で数クリックで構築。必要な分だけ使って、すぐスケール。グローバル展開も簡単。

例えるなら「家を建てる」のと「ホテルを借りる」くらいの違いがあります。自分のやりたいことにフォーカスし、インフラはAWSに任せるという発想が、これからのエンジニアには欠かせないと感じました。

おわりに

今回のAWSセミナーは、自分にとってまさに「クラウドの扉を開く」きっかけとなりました。難しそうに見えたクラウドも、しっかりと学べば確実に理解でき、資格取得や実践的なスキルアップにもつながります。

今後は無料利用枠を活用して実際に手を動かしながら、AWS認定資格（特にクラウドプラクティショナー）にもチャレンジしたいと思います。そして、ローカル環境だけでなく、クラウドでもインフラを設計・運用できるようになることで、エンジニアとしてのスキルの幅をもっと広げていきたいと思います。

今回はここまで
最後までご覧いただきありがとうございました！

Linux学習についてのまとめ 03 ファイルシステム

こんにちは。22年度入社の中島です。

前回はLinuC101試験に向けての学習の一環として、GNU/Linuxついての記事を作成しました。今回はLinuC101試験のファイルシステムについての内容をまとめました。この記事を通じて、ファイルシステムの基本的な内容、ファイルシステムのマウントとアンマウント、ファイルシステムのバックアップについて共有します。

1. ファイルシステムとは

ファイルシステムとは、コンピュータのストレージデバイス（HDD、SSDなど）上でデータを管理するための方法であり、データの保存、取得、整理を行います。ファイルシステムは、ファイルを格納する場所（ファイルシステムのブロック）とその情報を格納するメタデータを管理します。例えば、ファイルの名前、サイズ、作成日などです。

2. ファイルシステムの作成と管理

ファイルシステムを新しく作成するには、mkfsコマンドが一般的です。具体的な手順は以下の通りです。

ファイルシステムの作成

mkfs -t ext4 /dev/sdX1

1	mkfs -t ext4 /dev/sdX1

ファイルシステムの管理

作成したファイルシステムの管理には、tune2fs(extファイルシステム用)やxfs_admin(xfs用)といったコマンドが使用されます。例えば、tune2fsを使用してext4ファイルシステムの設定を変更することが可能です。

tune2fs -l /dev/sdX1

1	tune2fs -l /dev/sdX1

3. 一般的なファイルシステムタイプ

Linuxではいくつかのファイルシステムタイプがサポートされており、用途に応じて選択することが重要です。以下は代表的なファイルシステムタイプです。

コマンド	説明
ext3	ext3は、Linuxで広く使用されているジャーナリングファイルシステムで、ext2ファイルシステムの後継として登場しました。ジャーナリング機能により、システムクラッシュや突然の電源断からの回復が速くなります。
ext4	最も一般的なLinuxのファイルシステムであり、ジャーナリング機能を持ち、データの信頼性が向上しています。ext4は、安定性と速度のバランスが良いため、個人のPCやサーバーにも広く利用されています。
xfs	xfsは、大容量ファイルや高速な書き込みが必要なシステムで利用されます。特にデータベースやファイルサーバーに適しており、スナップショットやデータの圧縮機能を提供します。
btrfs	btrfsは、スナップショット機能や圧縮、自己修復機能を備えた新しいファイルシステムです。ファイルシステムの管理が容易で、ストレージの拡張性や効率性に優れています。
f2fs	フラッシュメモリ向けに最適化されたファイルシステムで、特にSSDやeMMCのようなフラッシュストレージに適しています。
iso9660	iso9660は、主にCD-ROMやDVD-ROMなどの光ディスクメディアに使用されるファイルシステム規格です。このファイルシステムは、光ディスクにおけるデータの標準的な配置方法を定めています。
UDF	UDFは、光ディスクやその他のストレージデバイス向けに設計されたファイルシステムで、iso9660の後継として登場しました。主にDVD、Blu-rayディスク、USBフラッシュドライブなどの書き込み可能なメディアで使用されます。

4. スワップ領域について

スワップ領域は、システムメモリ（RAM）が不足した際に使用されるディスク領域であり、仮想メモリの一部として機能します。スワップ領域を設定することで、システムがメモリ不足の際にハングアップせずに動作を維持することができます。

スワップ領域の作成例:

mkswap /dev/sdX2

1	mkswap /dev/sdX2

swapon /dev/sdX

1	swapon /dev/sdX

ここで、/dev/sd2はスワップ領域として使用するパーティションです。swaponコマンドでスワップを有効にすることができます。

5. ファイルシステムのマウントとアンマウント

ファイルシステムは、物理デバイス（ハードディスク、SSD、USBドライブなど）に格納されたデータにアクセスするために、システムに「マウント」して利用します。マウントとは、ファイルシステムを特定のディレクトリに接続し、そこからファイルにアクセスできるようにする操作です。アンマウントは、逆にファイルシステムを切り離し、デバイスを安全に取り外すための操作です。

Linuxでは、mountコマンドとumountコマンドを使ってファイルシステムをマウントおよびアンマウントします。

ファイルシステムのマウント

ファイルシステムをマウントするには、mountコマンドを使用します。マウントは、デバイスとマウントポイントというディレクトリを指定して行います。マウントポイントは、ファイルシステムが接続されるディレクトリで、通常は/mntや/mediaが利用されますが、任意のディレクトリを指定できます。

例えば、/dev/sda1というパーティションを/mntにマウントする場合、次のようにコマンドを実行します。

mount /dev/sda1 /mnt

1	mount /dev/sda1 /mnt

このコマンドを実行すると、/dev/sda1の内容が/mntディレクトリに表示され、そこからファイルを読み書きできるようになります。

例：ファイルシステムをマウントする

例えば、/dev/sda1という外部ドライブを/media/usbというディレクトリにマウントしたい場合、次のようにコマンドを実行します。

mount /dev/sdb1 /media/usb

1	mount /dev/sdb1 /media/usb

これで、/media/usbにアクセスすることで、外部ドライブ内のファイルを操作できるようになります。

マウントのオプション

mountコマンドには、さまざまなオプションを付けてマウントをカスタマイズできます。以下は代表的なオプションです

-t：マウントするファイルシステムのタイプを指定します（例：ext4、xfs）。bashコードをコピーする　

mount -t ext4 /dev/sda1 /mnt

1

mount -t ext4 /dev/sda1 /mnt
-o：特定のオプションを指定します。例えば、ro（読み取り専用）やnoexec（実行不可）など。bashコードをコピーする　

mount -o ro /dev/sda1 /mnt

1

mount -o ro /dev/sda1 /mnt
-v：詳細な出力を表示します。マウントの進行状況やエラーを確認できます。bashコードをコピーする　

mount -v /dev/sda1 /mnt

1

mount -v /dev/sda1 /mnt

永続的なマウント（/etc/fstabを使用）

一度マウントしたファイルシステムは、再起動後に自動的にマウントされるわけではありません。システムの起動時に自動的にマウントするためには、/etc/fstabというファイルに設定を追加する必要があります。

/etc/fstabファイルに、マウントするデバイスとマウントポイント、ファイルシステムタイプなどを記載します。例えば、/dev/sda1を/mntにマウントする設定は次のように記載します。

/dev/sda1 /mnt ext4 defaults 0 2

1	/dev/sda1 /mnt ext4 defaults 0 2

これで、システムが起動するたびに/dev/sda1が自動的に/mntにマウントされます。

ファイルシステムのアンマウント

ファイルシステムをアンマウントするには、umountコマンドを使用します。アンマウントは、ファイルシステムへのアクセスを停止し、デバイスを切り離す操作です。

アンマウントするには、マウントポイントまたはデバイスを指定します。例えば、/mntをアンマウントするには次のようにコマンドを実行します。

umount /mnt

1	umount /mnt

また、デバイス名を指定してアンマウントすることもできます。

umount /dev/sda1

1	umount /dev/sda1

アンマウント時の注意点

アンマウントを行う前に、マウントされているディレクトリ内のファイルが使用中でないことを確認する必要があります。ファイルが開かれていたり、プロセスがファイルシステムにアクセスしていると、アンマウントできない場合があります。
lsofコマンドやfuserコマンドを使って、ファイルシステムを使用しているプロセスを確認できます。

lsof /mnt

lsof /mnt

または

fuser -m /mnt

1	fuser -m /mnt

これらのコマンドを使って、ファイルシステムを使用しているプロセスを確認し、プロセスを終了させてからアンマウントすることができます。

6. ファイルシステムの整合性チェックと修復

ファイルシステムの整合性を維持するためには、定期的なチェックと修復が重要です。特に、システムがシャットダウン不完全であった場合や、ディスクの物理的な問題が発生した場合には、ファイルシステムが壊れることがあります。そのため、定期的なチェックと修復作業はシステムの安定性を保つために欠かせません。

Linuxでは、fsck（File System Consistency Check）コマンドを使用して、ファイルシステムのエラーをチェックし、修復することができます。fsckは、指定したファイルシステムに対して以下の作業を行います：

ファイルシステムのメタデータを確認し、破損している場合には修復
ファイルシステム内での不整合を検出し、修復
破損したファイルを隔離し、可能な限り復旧

fsckコマンドの使い方
ファイルシステムの整合性をチェックするためにfsckコマンドを使用します。例えば、/dev/sda1というパーティションのファイルシステムをチェックするには以下のコマンドを実行します。

fsck /dev/sda1

1	fsck /dev/sda1

このコマンドを実行すると、システムは自動的にファイルシステムを確認し、エラーが発見されると修復を試みます。

例: fsckの実行
例えば、次のようにコマンドを実行した場合、ファイルシステムにエラーがあったと仮定します。

fsck /dev/sda1

1	fsck /dev/sda1

出力例：

fsck from util-linux 2.34 e2fsck 1.44.5 (15-Dec-2018) Checking for unreferenced inodes.. Inode 123456789 not used (id=1234) ... /dev/sda1: 1/1000000 files (0.1% non-contiguous), 10000/1000000 blocks

1	fsck from util-linux 2.34 e2fsck 1.44.5 (15-Dec-2018) Checking for unreferenced inodes.. Inode 123456789 not used (id=1234) ... /dev/sda1: 1/1000000 files (0.1% non-contiguous), 10000/1000000 blocks

この場合、fsckはエラーを修復し、破損していないかを確認します。e2fsck（ext2/ext3/ext4ファイルシステムのチェックツール）は、実際に問題が見つかると、修復するかどうかを尋ねることがあります。たとえば、「修復するか？」という確認メッセージが表示されることがあります。

例文：

/dev/sda1: clean, 12345/1000000 files, 567890/2000000 blocks

1	/dev/sda1: clean, 12345/1000000 files, 567890/2000000 blocks

このメッセージは、ファイルシステムが正常であり、エラーがないことを意味します。

コマンドのオプション

fsckコマンドには、いくつかの便利なオプションがあります。例えば、-yオプションを使用すると、すべての修復を自動的に承認します。手動で確認することなく、エラーを修正する場合に便利です。
例文：

fsck -y /dev/sda1

1	fsck -y /dev/sda1

-nオプションを使用すると、修復せずにエラーメッセージを表示するだけになります。これを使うことで、実際に修復作業を行う前にエラーを確認できます。
出力例：

fsck -n /dev/sda1

1	fsck -n /dev/sda1

ブート時の自動チェック

多くのLinuxディストリビューションでは、システム起動時に自動的にファイルシステムのチェックを行います。もしファイルシステムに問題が発見されると、fsckが自動的に修復処理を行います。この処理が長時間かかる場合もあるので、定期的にディスク状態を確認しておくことが推奨されます。

例えば、システム起動時に「ディスクにエラーがあるため、fsckが実行されています」といったメッセージが表示されることがあります。

ファイルシステムの修復後

ファイルシステムが修復されると、fsckコマンドは修復後の状態を報告します。報告には、修復したエラーの数や修復内容が含まれます。例えば、次のような報告が表示されます。

/dev/sda1: 1000000/1000000 files (0.1% non-contiguous), 2000000/2000000 blocks

1	/dev/sda1: 1000000/1000000 files (0.1% non-contiguous), 2000000/2000000 blocks

これは、ファイルシステムに問題がなかったことを意味します。

ファイルシステムが修復できない場合

fsckがファイルシステムを修復できない場合もあります。その場合、手動でさらに調査したり、バックアップからの復元が必要です。例えば、物理的なディスク障害がある場合や、データが完全に破損している場合には、fsckでは回復できないことがあります。

そのため、定期的なバックアップと、fsckによる早期のチェックが非常に重要です。システムの信頼性を確保するために、バックアップの重要性を忘れないようにしましょう。

おわりに

今回の記事では、LinuC101試験に向けての学習の一環として、ファイルシステムの基本的な内容、ファイルシステムのマウントとアンマウント、ファイルシステムのバックアップなどについてまとめました。ファイルシステムの正しい管理は、Linuxシステムの安定性を保つために不可欠です。今回紹介したファイルシステムの作成と管理、各種ファイルシステムタイプ、スワップ領域の使用方法、マウントとアンマウント、整合性チェックとバックアップをしっかり理解し、実際の操作を繰り返すことで、LinuC 101試験にも十分に備えることができるでしょう。

今回はここまで
最後までご覧いただきありがとうございました！

Linux学習についてのまとめ 02 GNU/Linux

こんにちは。22年度入社の中島です。

現在、私はLinuCの101試験に合格するためにLinuxの学習を進めています。特にGNUに関する内容を理解することが重要であると感じ、これらの知識をブログとしてまとめました。この記事を通じて、GNU/Linuxの基本的な歴史やリチャード・ストールマンの貢献、さらにはLinuxのテキストフィルタコマンドについて共有します。

1. GNUの歴史について

GNUは「GNU’s Not Unix!」の略で、Unix互換のオペレーティングシステムを開発するために1983年にリチャード・ストールマンによって開始されたプロジェクトです。当時、ほとんどのソフトウェアがプロプライエタリ（専用）であり、ソースコードが公開されていませんでした。ストールマンは、ソフトウェアの自由な使用、改変、再配布を可能にすることを目指してGNUプロジェクトを立ち上げました。

GNUプロジェクトの最も重要な成果の一つは、GPL（GNU General Public License）です。GPLは、フリーソフトウェアに特化したライセンスであり、ユーザーにソフトウェアの自由を保障します。このライセンスは、ソフトウェアを自由に使用し、改変し、再配布することを許可しますが、改変や再配布されたソフトウェアも同様にGPLの下で公開される必要があります。この仕組みを「コピーレフト」と呼びます。コピーレフトは、ソフトウェアの自由を保護するための強力な手段であり、オープンソースソフトウェアの普及に大きく寄与しました。

コピーレフトの理念は、ソフトウェアが自由であるべきという考え方に基づいており、ユーザーがソフトウェアを制限なく利用できるようにすることを目的としています。このため、GPLはフリーソフトウェア運動の基盤となり、オープンソースコミュニティにも大きな影響を与えました。

GNUプロジェクトは、Unixと同様の機能を持つ多くのソフトウェアを開発しました。これらのソフトウェアには、コンパイラ（GCC）、テキストエディタ（Emacs）、シェル（Bash）などが含まれます。これらのツールは、現在も多くのユーザーに利用され、Linuxを含むさまざまなオペレーティングシステムで使用されています。

2. リチャード・ストールマンについて

リチャード・ストールマンは、フリーソフトウェア運動の先駆者であり、GNUプロジェクトの創始者です。1985年にフリーソフトウェア財団を設立し、ソフトウェアの自由を擁護する活動を続けています。彼の主張は、ソフトウェアがユーザーに自由を与えるべきであり、そのためにはソースコードが自由にアクセスできる状態でなければならないというものです。ストールマンの理念は、多くのフリーソフトウェアのライセンス（例：GPL）に反映されており、今日のオープンソースコミュニティに大きな影響を与えています。

3. GNUから生まれたLinux

GNUプロジェクトは多くのツールを開発しましたが、オペレーティングシステムの核となるカーネルは開発されていませんでした。1991年、リーナス・トーバルズによってLinuxカーネルが発表されました。GNUツールとLinuxカーネルを組み合わせることで、現在の多くのGNU/Linuxシステムが形成されました。このように、LinuxはGNUプロジェクトと密接に関連していますが、GNUそのものとは別の存在です。

4. GNU/Linuxのテキストフィルタコマンド

GNUシステムの基本コンポーネントには、GCC（コンパイラ）、glibc（ライブラリ）、Coreutils（コマンド）、GDB（GNUデバッガ)、Bashシェルなどが含まれています。
Coreutils（GNU Core Utilities）の中でも特徴的なのが、テキストデータを加工するコマンド群になります。シェル上でこれらのコマンドを組み合わせることで強力なデータ処理が可能です。

これらのテキストフィルタコマンドは、データ処理や分析において非常に役立つツールであり、試験勉強の一環として理解を深めることで、実際の業務でも役に立つと思いました。
業務で使うシーンを想定しながら、今回はそのコマンドと例文の一部をまとめようと思います。

代表的なテキストフィルタコマンド

コマンド	説明
grep	テキスト検索ツールで、指定したパターンに一致する行を抽出します。例: grep -i ’error’ application.log application.logファイル内で ‘error’ （大文字小文字区別なし）に一致する行を検索して表示します。
sed	ストリームエディタで、テキストの置換や削除、挿入を行います。例:sed ‘s/localhost/127.0.0.1/g’ /etc/hosts ホスト名をIPアドレスに置き換えます。設定ファイルを一括して修正する際に役立ちます。
awk	テキスト処理言語で、テキストのパターンマッチングと処理が可能です。例:awk ‘$3 == “root” {print $1}’ /etc/passwd /etc/passwdファイルからrootユーザーのユーザー名を抽出します。
sort	テキストデータをソート（並べ替え）します。例: sort -k3,3 -t, data.csv CSVファイルの3列目（例: 売上データ）を基準にしてソートします。
uniq	重複する行を削除します（通常はsortと組み合わせて使用されます）。例: sort access.log \| uniq -c アクセスログの重複するエントリを集計し、一意のリクエスト数を数えることができます。
cut	テキストの特定のフィールドを抽出します。例: cut -d ‘:’ -f 1 /etc/passwd /etc/passwdファイルからユーザー名のみを抽出します。
tr	文字の変換や削除を行います。例: echo ‘abc123’ \| tr ‘a-z’ ‘A-Z’ 出力結果の小文字を大文字に変換します。

これらのコマンドを使いこなすことで、テキストデータの効率的な処理と分析が可能になります。

おわりに

今回の記事では、LinuC101試験に向けての学習の一環として、GNU/Linuxの歴史やリチャード・ストールマンの貢献、そしてテキストフィルタコマンドについてまとめました。これらの知識を深めることで、Linuxシステムの理解がさらに深まったと感じています。特に、シェルスクリプトの作成や自動化されたデータ処理、システム管理業務において、これらのコマンドの組み合わせが強力なツールとなることを理解しました。また、実際の業務でのデータ処理や、エラーの迅速な検出・修正など、より効率的なシステム運用に役立つ点も大いに学ぶことができました。

今回はここまで
最後までご覧いただきありがとうございました！

LinuCの試験について

こんにちは。22年度入社の中島です。

この間、Linux資格のLinuCを受験しました。
今回私が受けたのは、LinuCレベル1（101試験）になります。
この試験は、101試験と102試験があり、認定されるためには2試験を（片方を合格していたら5年以内に）合格する必要があります。

今回は、LinucCレベル1 101試験を受けた感想や試験の内容を簡単に書いていこうと思います。

・Linux技術者認定「LinuC（リナック）」とは
クラウドやDX時代のITエンジニアに求められるシステム構築から運用管理に必要なスキルを証明できる技術者認定です。

・受験動機
この試験を受ける理由は、仕事に対する自信につなげられるようにするためと、これからの業務の役に立つと思い受験しました。

・予約と受験方法、前日までの準備について
今回はオンラインでの受験だったので、テストセンターでいかなくてよかったのですが、
試験を受けるにあたっての、本人確認書類の用意、受験スペース準備や規則などが大変でした。

・試験対策と試験概要
対策として、テキストでの学習や過去問を解くなどをしていました。一日に学習する範囲を決めてやったり、章まとめの問題集を何回も解きなおしていました。

LinuCレベル1（101試験）は試験時間は85分で出題数は60問でした。
以下は試験囲です。

第1章:　Linuxのインストールと仮想マシン・コンテナの利用
第2章:　ファイル・ディレクトリの操作と管理
第3章:　GNUとUnixのコマンド
第4章:　リポジトリとパッケージ管理
第5章:　ハードウェア、ディスク、パーティション、ファイルシステム

・勉強してみた感想
Linuxのことを何もわからない状態からのスタートだったので、なんとなく理解するのにも時間がかかりました。
特にコマンドとそのオプションを覚えきれず、とても苦労しました。

・結果と感想
結果は残念ながら不合格でした。
１～５章の全範囲まんべんなく出ていたので、全体的に復習が必要だと思いました。
受験した感想といたしましては、どのような形で問題が出されるのかわからず、緊張して問題とくペース配分がうまくいかず、時間が掛かりました。
それによって見直しを行う時間がありませんでした。
また、第3章、第4章のコマンドを忘れていたり、コマンドは合っているのにオプションを間違えてるなどのミスが目立ちました。

今回の試験で自分の努力不足をとても感じました。次回受験する際には過去問やりこみ、解くスピードを上げて見直しをする時間を作りたいと思います。模擬試験で正解8割を安定して出せるようになってから再度、受験したいと思います。

現在は、ping-tというサイトを使って過去問を解いています。
このサイトは、試験範囲・問題数・出題形式まで自由に決めることができて便利です。
間違ってもわかりやすい解説があるので、おすすめです。(アカウント登録が必要です。)

https://mondai.ping-t.com/users/sign_in

いかがでしたでしょうか。

久しぶりのブログでしたが、よいネタを見つけたら投稿していきたと思います。

最後までご覧いただきありがとうございました！

Linux学習についてのまとめ　０１

こんにちは。22年度入社の中島です。

最近はLinuxの資格であるLinuCを受験するために、Linuxの学習をしています。
今回は復習も兼ねて学習したもの、実際に使ったものの一部を紹介したいと思います。

shutdownコマンド
私が最初に覚えたコマンドで、システムを安全に停止するコマンドです。

12:00に時間指定でシャットダウンする場合

[crayon-688ab198909f8985076702 ]shutdown -h 12:00[/crayon]

すぐに再起動する場合

<br>

<br>

[crayon-688ab198909fe950220311 ]shutdown -r now[/crayon]

私がこのコマンドを使うときは、オプションの-rをよく使います。

書式　shutdown [オプション] 時間 [メッセージ]

オプション
-h 　シャットダウンする
-r 　シャットダウン後に再起動

cpコマンド
ファイルやディレクトリをコピーするコマンド。
業務では、WinSCPなどで追加したVMの共有フォルダからファイルをコピーするとき以下のようなコマンドでファイル情報を保持するオプションをつけ実施しました。

[crayon-688ab19890a02241862207 ]cp -rp vagrant/html/* /var/www/html[/crayon]

書式　cp [オプション] コピー元ファイル名　コピー先ファイル名
　　　cp [オプション] コピー元ファイル名　コピー先ディレクトリ

オプション
-f 　コピー先に同名のファイルがあれば上書きする
-i 　コピー先に同名のファイルがあれば上書きするかどうか確認する
-p 　コピー元ファイルの属性(所有者、所有グループ、アクセス権、タイムスタンプ)を
　　　保持したままコピーする

chownコマンド
ファイルに設定されている所有者を変更するコマンド。
業務ではApacheを起動する際、所有者が違ったのでオプションの-Rを使って対象ディレクトリの全ファイルの所有者を変更しました。

[crayon-688ab19890a06302706556 ]chown -R root vagrant[/crayon]

書式　chown [オプション] ユーザー [：グループ]　ファイル名やディレクトリ名

オプション
-R 　指定したディレクトリとその中にある全ファイルの所有者を変更する

lsコマンド
ディレクトリを指定した場合は、そのディレクトリ内のファイルを表示します。ファイル名を指定した場合は、そのファイルの属性を表示します。何も指定しない場合は、カレントディレクトリ内のファイルを表示します。ドットファイルも参照したかったため、以下のようなコマンドを実行して確認しました。

[crayon-688ab19890a0a316216963   inline="1" lang="sh" decode="true" ]ls -lA

1	[crayon-688ab19890a0a316216963 inline="1" lang="sh" decode="true" ]ls -lA

[/crayon]

書式　ls [オプション] (ファイル名あるいはディレクトリ名]

オプション
-l 　カレントディレクトリにあるファイルの詳細設定を表示
-A　ドットファイルも含めて表示。ただし./ および ../ をのぞく
-a　ドットファイルも含めて表示。

grepコマンド
ファイルやテキストの中に、正規表現によって表される検索文字列があるかどうかを調べます。引数にファイルを指定した場合、そのファイルの中で検索パターンにマッチした文字列が含まれる行をすべて表示します。

grep -n 'mod_http2' httpd.conf

1	grep -n 'mod_http2' httpd.conf

 　355:<IfModule mod_http2.c>

1	355:<IfModule mod_http2.c>

オプションの-nをつけることで、自分の探している文字が何行目にあるかを確認することができます。

書式　grep [オプション] 検索パターン [ファイル名]

オプション
-n 　検索結果とあわせて、行番号も表示する

いかがでしたでしょうか。

LinuCは、試験レベルが３つありレベル１の試験は、「101試験」と「102試験」の2試験に合格するとレベル1合格になります。Linuxの復習しながら、ブログの続きとしてを出していけたらと思います。

今回はここまで
最後までご覧いただきありがとうございました！

S3+CloudFront+Route 53を使った静的コンテンツ配信 Part 2 （lambda@edge編）

福岡拠点の野田です。

前回、S3を使った静的コンテンツ配信を実現しましたが、ちょっとカッコ悪い点がありました。

ドメイン直下については、 Default Root Object 設定すると https://サイト名/でアクセスしたときindex.html を参照するようにできます。ただし、サブディレクトリ配下はDefault Root Objectの設定が効きません。サブディレクトリ配下で/news/とアクセスしたとき、/news/index.htmlを参照するためにはlambda@edgeを使う必要があります。

/で終わるuriの場合に/index.htmlを参照する設定について、今回は以下の流れで設定を行います。

lambdaを追加
CloudFrontで使えるようにIAMを修正
lambdaにトリガーを追加し、CloudFrontと関連付け

lambdaを追加

リージョンus-east-1のlambda画面から関数を追加します。ほかのリージョンではCloudFrontへのトリガーを作成できないため、正しいリージョンが選択されているか確認してください。

https://console.aws.amazon.com/lambda/home?region=us-east-1

lambdaは１から作る形で進めます。

・関数名：subdir-redirect （適宜適当な名前を設定してください）
・ランタイム：nodejs (バージョンはデフォルトでOK）
・アクセス権限：AWSポリシーテンプレートから新しいロールを作成
・ロール名：cloudfront-lambda （適宜適当な名前を設定してください）
・ポリシーテンプレート：基本的なlambda@edgeのアクセス権限

関数詳細ページが表示されるので、関数コードに以下を追加します。

[crayon-688ab19890c08332033285  ]'use strict';
exports.handler = (event, context, callback) => {
    var request = event.Records[0].cf.request;
    request.uri = request.uri.replace(/\/$/, '\/index.html');
    return callback(null, request);
};

[crayon-688ab19890c08332033285 ]'use strict';

exports.handler = (event, context, callback) => {

var request = event.Records[0].cf.request;

request.uri = request.uri.replace(/\/$/, '\/index.html');

return callback(null, request);

};

[/crayon]

画面右上の「保存」を押下してコードを保存します。

CloudFrontで使えるようにIAMを修正

そのままでは使うことができないため、関数詳細ページ「アクセス権限」のタブを選択します。実行ロール「 cloudfront-lambda 」を編集し、末尾の「 IAM コンソールで cloudfront-lambda ロールを表示します。」のリンクをクリックします。

ロールの詳細ページから「信頼関係」のタブをクリックします。「信頼関係の編集」ボタンを押下して、以下のようにedgelambdaの設定を追加します。

[crayon-688ab19890c0c620569379  ]{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Principal": {
        "Service": [
          "lambda.amazonaws.com",
          "edgelambda.amazonaws.com"
        ]
      },
      "Action": "sts:AssumeRole"
    }
  ]
}

[crayon-688ab19890c0c620569379 ]{

"Version": "2012-10-17",

"Statement": [

{

"Effect": "Allow",

"Principal": {

"Service": [

"lambda.amazonaws.com",

"edgelambda.amazonaws.com"

]

"Action": "sts:AssumeRole"

}

]

}

[/crayon]

これにより信頼されたエンティティにedgelambdaが追加されます。

信頼されたエンティティ
ID プロバイダー lambda.amazonaws.com
ID プロバイダー edgelambda.amazonaws.com

続いて「アクセス権限」のタブに再度戻ります。＋インラインポリシーの追加から以下のポリシーを追加します。

Lambda: GetFunction, EnableReplication (対象リソースは、先ほど登録したsubdir-redirect lambda のARNを指定)
IAM: CreateServiceLinkedRole（対象リソースはすべて）
CloudFront: UpdateDistribution（対象リソースは、展開するCloudFrontのARNを指定）

ここまでやってようやくlambda@edgeが使えるようになります。

lambdaにトリガーを追加し、CloudFrontと関連付け

仕上げにlambdaの関数詳細画面に戻ります。画面上の「アクション」から新しいバージョンを発行します。コメントは必要あれば適宜入力してください。

そののちにデザイナーから「トリガー」を追加します。トリガーの種類は、CloudFrontを選択します。ここでCloudFrontが選択できない場合はlambdaのリージョンが間違っていますので、最初からやり直してください。設定はデフォルトのままで以下のチェックボックスにチェックを入れます。

[crayon-688ab19890c10354261567  ] Lambda@Edge へのデプロイを確認 
関数のこのバージョンが上記のトリガーと関連付けられ、利用可能なすべての AWS リージョン間でレプリケートされることに同意します。

1 2	[crayon-688ab19890c10354261567 ] Lambda@Edge へのデプロイを確認関数のこのバージョンが上記のトリガーと関連付けられ、利用可能なすべての AWS リージョン間でレプリケートされることに同意します。

[/crayon]

追加ボタンを押下するとCloudFrontへの更新が入ります。Distributionの更新が終わるまでしばし待つと、晴れてサブディレクトリのリダイレクト処理を利用することができるようになります。

まとめ

lambdaというと単機能のAPIや軽量サーバーとして使うイメージが強いですが、実はいろいろなところに組み込めます。lambda@edgeを利用することでCloudFrontに対してヘッダーのカスタマイズ、 BASIC認証など多岐にわたって処理を組み込むことができます。静的コンテンツに対してちょっとした動的処理を行いたいな、というときはlambda@edgeの出番です。是非ご活用いただければと思います。

面倒なところもありますが、ひと手間かけるといろいろなことができるのがAWSの良いところ。いろいろエンジニアとしていろいろHackしていければと思います。

S3+CloudFront+Route 53を使った静的コンテンツ配信

福岡拠点の野田です。

WordPressで運用していた個人サイトをメンテしなくなったので、S3とCloudFrontとRoute 53を使って静的コンテンツ配信方式に切り替えてみました。手順の大きな流れは以下のようになります。

S3にコンテンツを配置
CloudFrontを設定
Route53でCloudFrontへ振り分け

S3 にコンテンツを配置

まずは、wget で既存サイトを取得します。

[crayon-688ab19890d9d193044168  ]wget --mirror --page-requisites --span-hosts --quiet --show-progress --no-parent --convert-links --no-host-directories --adjust-extension --execute robots=off （サイトURL）

1	[crayon-688ab19890d9d193044168 ]wget --mirror --page-requisites --span-hosts --quiet --show-progress --no-parent --convert-links --no-host-directories --adjust-extension --execute robots=off （サイトURL）

[/crayon]

日本向けに配信することを考え、 S3 の東京リージョンにて新規バケットを作成して、上記取得したファイルを配置します。

S3における設定ですが、アクセス権限の設定を行います。静的コンテンツとして公開するため、以下のバケットポリシーのブロックをオフにすることで外部からのアクセスを行えるようにします。

新規のパブリックバケットポリシーまたはアクセスポイントポリシーを介して付与されたバケットとオブジェクトへのパブリックアクセスをブロックするオフ
任意のパブリックバケットポリシーまたはアクセスポイントポリシーを介したバケットとオブジェクトへのパブリックアクセスとクロスアカウントアクセスをブロックするオフ

バケットポリシーは、以下のようなCloudFrontからの接続を許可する設定を行いますが、CloudFront側から設定ができるため、ひとまずスキップで大丈夫です。

[crayon-688ab19890da1756367876  ]{
     "Version": "2012-10-17",
     "Statement": [
         {
             "Sid": "2",
             "Effect": "Allow",
             "Principal": {
                 "AWS": "arn:aws:iam::cloudfront:user/CloudFront Origin Access Identity OAIのID"
             },
             "Action": "s3:GetObject",
             "Resource": "arn:aws:s3:::バケット名/"
         }
     ]
 }

[crayon-688ab19890da1756367876 ]{

"Version": "2012-10-17",

"Statement": [

{

"Sid": "2",

"Effect": "Allow",

"Principal": {

"AWS": "arn:aws:iam::cloudfront:user/CloudFront Origin Access Identity OAIのID"

"Action": "s3:GetObject",

"Resource": "arn:aws:s3:::バケット名/"

}

]

}

[/crayon]

CloudFrontを設定

Create DistributionでCDNを新規作成します。

Web/RTMPの選択でWebを選択
Origin Domain NameにS3のバケットを選択
Origin Pathは空欄でOK
Origin IDは任意のIDを設定（S3-バケット名みたいな感じで設定しました)
Restrict Bucket Accessは、YES
Origin Access Identityは、 Create a New Identity。
Grant Read Permissions on Bucketは Yes, Update Bucket Policy （これが先ほどのS3バケットポリシーに反映されますので、一応S3側でも設定されているか確認）
Viewer Protocol Policyは、Redirect HTTP to HTTPS (httpからhttpsリダイレクト)
Allowed HTTP Methodsは、GET/HEADのみで対応（CORSを考えるとOPTIONSまでやってもいいかもしれません）
Compress Objects Automaticallyは、true（圧縮化。転送量削減）
Price Classはベストパフォーマンス
AWS WAF Web ACLは、None
Alternate Domain Namesは割り当てるドメイン名を改行区切りで入力。
証明書については、独自ドメインで割り当てる場合、ACMに登録したものを選択。
残りはデフォルトで登録

Distribution作成後、 GeneralタブでEditボタンを押下して、以下を設定します。

Default Root Objectにindex.htmlを設定

続いて Restrictionsタブを選択して、GeoRestrictionをEditします。

今回は、日本のみを対象とします。全世界を対象とするとコストと直結します。1日1000円以上かかってもいい！どんな攻撃もどんとこい！という方以外は、対象を絞ったほうが良いと思います（私もこれで当初1日放置して1000円かかってしまい冷や汗、急遽制限を追加しました）。

Route53でCloudFrontへ振り分け

仕上げにRoute53からCloudFrontへ振り分けします。A(IPv4アドレス)およびAAAA(IPv6アドレス）のエイリアス指定でCloudFrontにつなげることができます。

まとめ

Cloudは設定をミスると高額な請求が発生してしまうリスクはありますが、うまく使えば個人で使っても安く運用することができます。最近では予算設定や請求が高額になりそうなときにアラートも出せる機能もありますので、そうしたものを組み合わせて、安全に運用すると良いと思います。先月からの運用の感じだとアクセス数次第なところがありますが、100円～300円/月ぐらいで運用できそうな感じでした。

初心者にはおすすめはしませんが、興味ある方は是非チャレンジしてみてください。

AWSでインスタンスを停止し、再起動した時にパブリックIPが割り振られない場合

AWS特訓中の宮里です。

AWSでインスタンスを作成したときに、少し困った現象があったため情報共有したいと思います。

AWSで作成したインスタンスを一旦停止後、ネットワークインターフェイスを追加し、再起動した後にパブリックIPが割り振られない現象が発生しました。

？？？？？となりながら、再起動を何度か試すもパブリックIPは復活せず。
作成したばかりのインスタンスだったので、インスタンスを一から作成し直し、特に問題は起こりませんでした。
その後、気になったので原因を調べてみると、AWS公式のドキュメントに今回の現象の解答がありました。

下記、公式のドキュメントから一部引用します。

手動でパブリック IP アドレスをインスタンスに関連付けること、また、手動でインスタンスから割り当て解除することはできません。場合によって、パブリック IP アドレスはインスタンスから解放されたり、新しいインスタンスに割り当てられたりします。
インスタンスが停止または終了されると、インスタンスのパブリック IP アドレスは解放されます。停止していたインスタンスが再起動されると、そのインスタンスには新しいパブリック IP アドレスが送信されます。
VPC 内のインスタンスのパブリック IP アドレスが既に解放されている場合には、複数のネットワークインターフェイスがインスタンスにアタッチされていると、インスタンスに新しいパブリック IP アドレスは送信されません。

出典:
AWS ドキュメント「パブリック IPv4 アドレスと外部 DNS ホスト名」

インスタンスを再起動するときは、プライマリENI以外はインスタンスにアタッチしてはいけないということでした。。。

少しづつ身につけていきたいと思います。

AWSのタイムゾーン設定でハマった件

福岡拠点の宮里です。
先日、アパッチのアクセスログをアーカイブして一定期間保存する作業を行っていたのですが、

apache-loggenでダミーアクセスログの生成

ログを確認していると、何か違和感が…

|02/May/2018:09:24:59 +0000|

私「あれ？もう出社して9時間は経ってて、もう今日も終わっちまうのかなぁって気がしていたけど」

心の中の金子賢「バカヤロー、まだ始まってもいねーよ」

サーバー時刻をUTCからJSTへ変更

あれあれあれと心を鎮めながら、サーバーに設定されているタイムゾーンを確認してみると、

strings /etc/localtime

#出力結果
TZif2
TZif2
UTC0 #←これ

strings /etc/localtime

#出力結果

TZif2

UTC0 #←これ

このサーバーのタイムゾーンはUTC。
このままだとなにかと不都合です。
心臓にもわるいので、JST時間帯へ変更したいと思います。

sysconfigディレクトリの設定ファイル(clock)からタイムゾーンを修正します。
ひとまずバックアップ取って、

cp /etc/sysconfig/clock{,.orig}

#/etc/sysconfig/clockの修正
vi /etc/sysconfig/clock

#下記に追記修正
ZONE="Asia/Tokyo"
UTC=false

cp /etc/sysconfig/clock{,.orig}

#/etc/sysconfig/clockの修正

vi /etc/sysconfig/clock

#下記に追記修正

ZONE="Asia/Tokyo"

UTC=false

シンボリックリンクの向き先Asia/Tokyoへ変更します。

ln -sf /usr/share/zoneinfo/Asia/Tokyo /etc/localtime

#確認
ls -l /etc/localtime
/etc/localtime -> /usr/share/zoneinfo/Asia/Tokyo

#設定変更した時刻を確認
strings /etc/localtime

#出力結果
TZif2
TZif2
JST-9 #←これ

ln -sf /usr/share/zoneinfo/Asia/Tokyo /etc/localtime

#確認

ls -l /etc/localtime

/etc/localtime -> /usr/share/zoneinfo/Asia/Tokyo

#設定変更した時刻を確認

strings /etc/localtime

#出力結果

TZif2

JST-9 #←これ

サーバーのタイムゾーンがUTCからJSTに変わりました。

これでひと安心かと思いきや、
この作業を行う前にすでに記録されているログの時刻をJSTに修正しないと何かと収まりがわるいです。
なので、USTで記録されているログをJSTへと変換するスクリプトを作りたいと思います。

既に出力されているログの時刻をJSTへ修正

スクリプトは、サーバーに標準でインストールされているpythonで作成してライブラリをひとつだけ追加します。

pytzの取得

cd /適当なディレクトリ/

wget https://files.pythonhosted.org/packages/10/76/52efda4ef98e7544321fd8d5d512e11739c1df18b0649551aeccfb1c8376/pytz-2018.4.tar.gz

tar zxvf pytz-2018.4.tar.gz
cd pytz-2018.4
# 解凍したディレクトリから本体をコピー
cp pytz-2018.4/pytz /作業ディレクトリ/

cd /適当なディレクトリ/

wget https://files.pythonhosted.org/packages/10/76/52efda4ef98e7544321fd8d5d512e11739c1df18b0649551aeccfb1c8376/pytz-2018.4.tar.gz

tar zxvf pytz-2018.4.tar.gz

cd pytz-2018.4

# 解凍したディレクトリから本体をコピー

cp pytz-2018.4/pytz /作業ディレクトリ/

JSTへ変換するスクリプト
changeJst.py

# /usr/bin/python
# coding: utf-8
import sys
import os
import shutil
import re
import datetime
import pytz

#ディレクトリへのパス
logDirPath = '/ログのディレクトリパス/'

#正規表現
#パスにマッチ
fileNamePtn = '(access|error)_log\.[0-9]{8}$'

#ファイル名にマッチ
fileName_ptn = '.*fileName.*(access|error)_log\.[0-9]{8}$'

#access_logにマッチさせる
accsNamePtn = 'access_log\.[0-9]{8}$'
#error_logにマッチさせる
errNamePtn = 'error_log\.[0-9]{8}$'

#アクセスログ内のUTC時刻マッチ
#例:[22/May/2018:08:21:01 +0000]
accs_ptn = '[0-9]{2}/\D{3}/[0-9]{4}:[0-9]{2}:[0-9]{2}:[0-9]{2}\s\+[0-9]{4}'

#実はJST⁇の行のチェック
accs_ptn_jst = '[0-9]{2}/\D{3}/[0-9]{4}:[0-9]{2}:[0-9]{2}:[0-9]{2}\s\+0900'

#エラーログの時刻にマッチ
#例:[Tue Jun 07 15:34:25.126709 2670]
error_ptn = '\D{3}\s\D{3}\s[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}\.[0-9]{6}\s2[0-9]{3}'

def changeJST(string):
    result = ""
    jst_time = ""
    #もしJST時刻ならスルー
    if re.search(accs_ptn_jst, string):
      return None
    #アクセスログにマッチ
    elif re.search(accs_ptn, string):
      ff = re.search(accs_ptn, string)
      utc = []
      #月
      ffDec = re.search('/\D{3}', ff.group(0))
      utc.append(ffDec.group(0)[1:])
      #日
      ffDec = re.search('[0-9]{2}', ff.group(0))
      utc.append(ffDec.group(0))
      #時間
      ffDec = re.search(':[0-9]{2}:[0-9]{2}:[0-9]{2}', ff.group(0))
      utc.append(ffDec.group(0)[1:])
      #時差
      ffDec = re.search('\+[0-9]{4}', ff.group(0))
      utc.append(ffDec.group(0))
      #年
      ffDec = re.search('2[0-9]{3}', ff.group(0))
      utc.append(ffDec.group(0))
      #並べ替え
      #形式:Nov 29 06:08:08 +0000 2006
      result = "%s %s %s %s %s" % (utc[0], utc[1], utc[2], utc[3], utc[4])
      utcDate = datetime.datetime.strptime(result, '%b %d %H:%M:%S +0000 %Y')
      jstTimezone = pytz.timezone('Asia/Tokyo')
      #Asia/Tokyoへ変換後、元のログフォーマットへ戻す
      jst_time = jstTimezone.fromutc(utcDate)
      #形式[07/Jun/2018:01:47:12 +0900]
      jst_time = jst_time.strftime('%d/%b/%Y:%X %z')
      return jst_time
    #エラーログにマッチ
    elif re.search(error_ptn, string):
      ff = re.search(error_ptn, string)
      utc = []
      #曜日
      ffDec = re.search('^\D{3}\s', ff.group(0))
      utc.append(ffDec.group(0)[:-1])
      #月
      ffDec = re.search('\s\D{3}\s', ff.group(0))
      utc.append(ffDec.group(0)[1:][:-1])
      #日
      ffDec = re.search('\s[0-9]{2}\s', ff.group(0))
      utc.append(ffDec.group(0)[1:][:-1])
      #時間
      ffDec = re.search('\s[0-9]{2}:[0-9]{2}:[0-9]{2}', ff.group(0))
      utc.append(ffDec.group(0)[1:])
      #id
      ffDec = re.search('\.[0-9]{6}', ff.group(0))
      utc.append(ffDec.group(0))
      #年
      ffDec = re.search('\s2[0-9]{3}', ff.group(0))
      utc.append(ffDec.group(0)[1:])
      
      #エラーログにマッチ
      #配列の中身の例:['Thu', 'Jun', '07', '06:35:13', '.378829', '2018']
      #並べ替え
      #形式:Nov 29 06:08:08 +0000 2006
      result = "%s %s %s +0000 %s" % (utc[1], utc[2], utc[3], utc[5])
      utcDate = datetime.datetime.strptime(result, '%b %d %H:%M:%S +0000 %Y')
      jstTimezone = pytz.timezone('Asia/Tokyo')
      #Asia/Tokyoへ変換後、元のログフォーマットへ戻す
      jst_error = jstTimezone.fromutc(utcDate)
      #形式:[Tue Jun 05 07:44:15.465239 2018]
      #Thu Jun 07 15:35:13 2018
      jst_time = jst_error.strftime('%a %b %d ')
      jst_time += jst_error.strftime('%X')
      jst_time += utc[4]
      jst_time += jst_error.strftime(' %Y')
      return jst_time
    else:
        return None

#標準入力から読込
for line in sys.stdin:    
    #オリジナルログの保存ディレクトリの作成
    #保存ディレクトリの存在チェック後、存在しなければmkdir
    if os.path.isdir("%sfileName" % logDirPath) is not True:
     os.makedirs("%sfileName" % logDirPath)
    #行末の改行を削除
    line = line.rstrip()
    #Readでオープン
    file = open(line, "r")
    newFileName = ""
    #念のためファイルの存在チェック後、
    #読み込んだファイルを保存ディレクトリへ移動
    if os.path.exists(line):
      fileName = re.search(fileNamePtn, line)
      fName = fileName.group(0)
      if re.search(fileName_ptn, line):
        fPath = "%sfileName/%s" % (logDirPath, fName)
        shutil.move(line, fPath)

      #読み込んだファイルを1行ずつ処理
      for row in file:
        #UTCからJSTへ変換する関数。JSTに変換された日付の文字列が返ってくる
        toJst = changeJST(row)
        utcToJst = ""
        if toJst is not None:
          if re.search(accsNamePtn, line):
            utcToJst = re.sub(accs_ptn, toJst, row)
          elif re.search(errNamePtn, line):
            utcToJst = re.sub(error_ptn, toJst, row)
          #新規ファイルへの書き込み。無限ループ回避の名前変更
          newFileName = line + ".log"
          newfile = open(newFileName, "a")
          newfile.write(utcToJst)
          newfile.close()
    file.close()
    #元のファイル名へ戻す
    if os.path.isfile(newFileName):      
      os.rename(newFileName, line)
    else:
      #ファイル全体で修正が無かったときに保存ディレクトリにmvしたファイルを戻す
      if re.search(fileName_ptn, line):
        fPath = "%sfileName/%s" % (logDirPath, fName)
        shutil.copy2(fPath, line)

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

# /usr/bin/python

# coding: utf-8

import sys

import os

import shutil

import re

import datetime

import pytz

#ディレクトリへのパス

logDirPath = '/ログのディレクトリパス/'

#正規表現

#パスにマッチ

fileNamePtn = '(access|error)_log\.[0-9]{8}$'

#ファイル名にマッチ

fileName_ptn = '.*fileName.*(access|error)_log\.[0-9]{8}$'

#access_logにマッチさせる

accsNamePtn = 'access_log\.[0-9]{8}$'

#error_logにマッチさせる

errNamePtn = 'error_log\.[0-9]{8}$'

#アクセスログ内のUTC時刻マッチ

#例:[22/May/2018:08:21:01 +0000]

accs_ptn = '[0-9]{2}/\D{3}/[0-9]{4}:[0-9]{2}:[0-9]{2}:[0-9]{2}\s\+[0-9]{4}'

#実はJST⁇の行のチェック

accs_ptn_jst = '[0-9]{2}/\D{3}/[0-9]{4}:[0-9]{2}:[0-9]{2}:[0-9]{2}\s\+0900'

#エラーログの時刻にマッチ

#例:[Tue Jun 07 15:34:25.126709 2670]

error_ptn = '\D{3}\s\D{3}\s[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}\.[0-9]{6}\s2[0-9]{3}'

def changeJST(string):

result = ""

jst_time = ""

#もしJST時刻ならスルー

if re.search(accs_ptn_jst, string):

return None

#アクセスログにマッチ

elif re.search(accs_ptn, string):

ff = re.search(accs_ptn, string)

utc = []

#月

ffDec = re.search('/\D{3}', ff.group(0))

utc.append(ffDec.group(0)[1:])

#日

ffDec = re.search('[0-9]{2}', ff.group(0))

utc.append(ffDec.group(0))

#時間

ffDec = re.search(':[0-9]{2}:[0-9]{2}:[0-9]{2}', ff.group(0))

utc.append(ffDec.group(0)[1:])

#時差

ffDec = re.search('\+[0-9]{4}', ff.group(0))

utc.append(ffDec.group(0))

#年

ffDec = re.search('2[0-9]{3}', ff.group(0))

utc.append(ffDec.group(0))

#並べ替え

#形式:Nov 29 06:08:08 +0000 2006

result = "%s %s %s %s %s" % (utc[0], utc[1], utc[2], utc[3], utc[4])

utcDate = datetime.datetime.strptime(result, '%b %d %H:%M:%S +0000 %Y')

jstTimezone = pytz.timezone('Asia/Tokyo')

#Asia/Tokyoへ変換後、元のログフォーマットへ戻す

jst_time = jstTimezone.fromutc(utcDate)

#形式[07/Jun/2018:01:47:12 +0900]

jst_time = jst_time.strftime('%d/%b/%Y:%X %z')

return jst_time

#エラーログにマッチ

elif re.search(error_ptn, string):

ff = re.search(error_ptn, string)

utc = []

#曜日

ffDec = re.search('^\D{3}\s', ff.group(0))

utc.append(ffDec.group(0)[:-1])

#月

ffDec = re.search('\s\D{3}\s', ff.group(0))

utc.append(ffDec.group(0)[1:][:-1])

#日

ffDec = re.search('\s[0-9]{2}\s', ff.group(0))

utc.append(ffDec.group(0)[1:][:-1])

#時間

ffDec = re.search('\s[0-9]{2}:[0-9]{2}:[0-9]{2}', ff.group(0))

utc.append(ffDec.group(0)[1:])

#id

ffDec = re.search('\.[0-9]{6}', ff.group(0))

utc.append(ffDec.group(0))

#年

ffDec = re.search('\s2[0-9]{3}', ff.group(0))

utc.append(ffDec.group(0)[1:])

#エラーログにマッチ

#配列の中身の例:['Thu', 'Jun', '07', '06:35:13', '.378829', '2018']

#並べ替え

#形式:Nov 29 06:08:08 +0000 2006

result = "%s %s %s +0000 %s" % (utc[1], utc[2], utc[3], utc[5])

utcDate = datetime.datetime.strptime(result, '%b %d %H:%M:%S +0000 %Y')

jstTimezone = pytz.timezone('Asia/Tokyo')

#Asia/Tokyoへ変換後、元のログフォーマットへ戻す

jst_error = jstTimezone.fromutc(utcDate)

#形式:[Tue Jun 05 07:44:15.465239 2018]

#Thu Jun 07 15:35:13 2018

jst_time = jst_error.strftime('%a %b %d ')

jst_time += jst_error.strftime('%X')

jst_time += utc[4]

jst_time += jst_error.strftime(' %Y')

return jst_time

else:

return None

#標準入力から読込

for line in sys.stdin:

#オリジナルログの保存ディレクトリの作成

#保存ディレクトリの存在チェック後、存在しなければmkdir

if os.path.isdir("%sfileName" % logDirPath) is not True:

os.makedirs("%sfileName" % logDirPath)

#行末の改行を削除

line = line.rstrip()

#Readでオープン

file = open(line, "r")

newFileName = ""

#念のためファイルの存在チェック後、

#読み込んだファイルを保存ディレクトリへ移動

if os.path.exists(line):

fileName = re.search(fileNamePtn, line)

fName = fileName.group(0)

if re.search(fileName_ptn, line):

fPath = "%sfileName/%s" % (logDirPath, fName)

shutil.move(line, fPath)

#読み込んだファイルを1行ずつ処理

for row in file:

#UTCからJSTへ変換する関数。JSTに変換された日付の文字列が返ってくる

toJst = changeJST(row)

utcToJst = ""

if toJst is not None:

if re.search(accsNamePtn, line):

utcToJst = re.sub(accs_ptn, toJst, row)

elif re.search(errNamePtn, line):

utcToJst = re.sub(error_ptn, toJst, row)

#新規ファイルへの書き込み。無限ループ回避の名前変更

newFileName = line + ".log"

newfile = open(newFileName, "a")

newfile.write(utcToJst)

newfile.close()

file.close()

#元のファイル名へ戻す

if os.path.isfile(newFileName):

os.rename(newFileName, line)

else:

#ファイル全体で修正が無かったときに保存ディレクトリにmvしたファイルを戻す

if re.search(fileName_ptn, line):

fPath = "%sfileName/%s" % (logDirPath, fName)

shutil.copy2(fPath, line)

粗いスクリプトですが、ひとまず期待通りに動くことが確認できましたので、作業するサーバーのhttpdを停止してスクリプトを実行しました。ちなみにAWSのELBがunhealthyを認識して振り分けを開始するまで約1分~2分ほどかかるようです。認識する前にhttpdを止めると502で振り分けもされなくなるので注意が必要です。

処理するディレクトリのバックアップを取って実行。

#処理するファイル数の確認
find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' -c

#スクリプト実行
find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' | python /スクリプトのディレクトリ/changeJst.py > log.txt

#エラーチェックスクリプト実行
find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' | python /ディレクトリ/errCheck.py > errCheck0308.txt

#処理後のファイル数の確認
find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' -c

#差分チェック
diff -s -q -r /ディレクトリ/ /バックアップディレクトリ/ > diff.txt

diff -y /ディレクトリ/access_log.20180304 /バックアップディレクトリ/access_log.20180304.log > diff-fileName_log.txt

#処理するファイル数の確認

find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' -c

#スクリプト実行

find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' | python /スクリプトのディレクトリ/changeJst.py > log.txt

#エラーチェックスクリプト実行

find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' | python /ディレクトリ/errCheck.py > errCheck0308.txt

#処理後のファイル数の確認

find /ディレクトリ/ -type f | grep -E '.*(access|error)_log\.[0-9]{8}$' -c

#差分チェック

diff -s -q -r /ディレクトリ/ /バックアップディレクトリ/ > diff.txt

diff -y /ディレクトリ/access_log.20180304 /バックアップディレクトリ/access_log.20180304.log > diff-fileName_log.txt

なんとか完了です。
サーバー時刻もUTCからJSTへ変更します。
その後、httpdを再起動。
無事に現在時刻が18時に修正されました。
やっと終わっちまえます。

あれ、cronの実行がおかしい

それから様子をみること数日。
dateコマンドやログに出力される時刻はしっかりUTCからJSTに変更がされているけど、cronに設定したタスクの実行時間がおかしい！どうにも9時間遅れて実行されている！と気づきました。
調べてみるとサーバーのタイムゾーンを変更しただけではcronの実行時刻への反映がされないようです。crondを再起動してJSTタイムゾーンの反映が必要でした。。。

crontabの設定ファイルへtimezoneを記述して、crondの再起動。

vi /etc/crontab
------
#下記の行を追記
CRON_TZ=Asia/Tokyo

------

#crondの再起動
service crond restart

vi /etc/crontab

------

#下記の行を追記

CRON_TZ=Asia/Tokyo

------

#crondの再起動

service crond restart

これでcronの実行時間にもJSTが反映されました。

VPSサーバーのリソース不足を回避する方法

福岡拠点の野田です。もうすぐ花見の季節ですね。来週か再来週あたり、お昼休みの合間を縫って花見に行きたいと思っています。

さて、今日は、仮想サーバーのリソース状況について話をしようと思います。
皆さんは、VPS環境で以下のような画面を見たことがありますでしょうか。開発用だったり、低予算の貧弱な環境では、結構こういう場面に遭遇することもあります。

The following exception is caused by a lack of memory or swap, or not having swap configured
Check https://getcomposer.org/doc/articles/troubleshooting.md#proc-open-fork-failed-errors for details
[ErrorException]
proc_open(): fork failed - Cannot allocate memory

The following exception is caused by a lack of memory or swap, or not having swap configured

Check https://getcomposer.org/doc/articles/troubleshooting.md#proc-open-fork-failed-errors for details

[ErrorException]

proc_open(): fork failed - Cannot allocate memory

上記は、composer を実行した際に発生したエラーです。このエラーがでたあと、httpd をいったん停止してから実行すると普通に実行できたりします。これは、仮想サーバーのリソースが不足するために発生しているエラーになります。こういうときは、都度、エラーが出るたび、httpdを止めて、ということをしなければいけないのでしょうか。

仮想サーバのリソース状況をチェックするには以下のようなコマンドがあります。

cat /proc/user_beancounters

1	cat /proc/user_beancounters

この中のprivvmpagesという値に注目します。これは、プライベート仮想メモリサイズです。リソースを解放するためには、httpd など消費リソースが大きいサービスを再起動するとリソースが解放されます。

以下は、リソース情報をチェックし、閾値を越えてリソースが足りない状態になると httpd サーバーを再起動するスクリプトになります。

/root/bin/restart.sh

#!/bin/bash
test `expr `grep privvmpages /proc/user_beancounters | awk '{ print int(($4-$2)*4/1024) }'` + 0` -lt 800 && /etc/init.d/httpd restart

1 2	#!/bin/bash test `expr `grep privvmpages /proc/user_beancounters \| awk '{ print int(($4-$2)*4/1024) }'` + 0` -lt 800 && /etc/init.d/httpd restart

シェルを毎分 cron 実行したら、リソースがないときは、httpdを再起動して、適宜、リソースが解放されるという仕組みです。

*/1 * * * * /root/bin/restart.sh

1	/1 * * * /root/bin/restart.sh

ちなみに800 というのはなんとなくの感覚値です(・ω<) 。某VPSサーバーでは、httpd を再起動すると 3000 くらいまで回復します。300 とか切るとセグメンテーションエラーとかメモリ関連のエラーがよく発生します。

これでサーバーのリソース不足でエラーとなるイライラも収まるでしょう。それでは、Have a nice server life!

2025年7月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31