Kubernetes
docs
ヘルスチェック
Kubernetes API health endpoints | Kubernetes
APIエンドポイントとして /readyz
と /livez
が用意されている。
$ curl -k 'https://192.168.0.131:6443/readyz'
ok
K3sだと認証が必要
$ curl -k -H "Authorization: Bearer $TOKEN" 'https://192.168.0.75:6443/livez?verbose'
[+]ping ok
[+]log ok
[+]etcd ok
[+]poststarthook/start-kube-apiserver-admission-initializer ok
[+]poststarthook/generic-apiserver-start-informers ok
[+]poststarthook/priority-and-fairness-config-consumer ok
[+]poststarthook/priority-and-fairness-filter ok
[+]poststarthook/storage-object-count-tracker-hook ok
[+]poststarthook/start-apiextensions-informers ok
[+]poststarthook/start-apiextensions-controllers ok
[+]poststarthook/crd-informer-synced ok
[+]poststarthook/start-service-ip-repair-controllers ok
[+]poststarthook/rbac/bootstrap-roles ok
[+]poststarthook/scheduling/bootstrap-system-priority-classes ok
[+]poststarthook/priority-and-fairness-config-producer ok
[+]poststarthook/start-system-namespaces-controller ok
[+]poststarthook/bootstrap-controller ok
[+]poststarthook/start-cluster-authentication-info-controller ok
[+]poststarthook/start-kube-apiserver-identity-lease-controller ok
[+]poststarthook/start-deprecated-kube-apiserver-identity-lease-garbage-collector ok
[+]poststarthook/start-kube-apiserver-identity-lease-garbage-collector ok
[+]poststarthook/start-legacy-token-tracking-controller ok
[+]poststarthook/aggregator-reload-proxy-client-cert ok
[+]poststarthook/start-kube-aggregator-informers ok
[+]poststarthook/apiservice-registration-controller ok
[+]poststarthook/apiservice-status-available-controller ok
[+]poststarthook/kube-apiserver-autoregistration ok
[+]autoregister-completion ok
[+]poststarthook/apiservice-openapi-controller ok
[+]poststarthook/apiservice-openapiv3-controller ok
[+]poststarthook/apiservice-discovery-controller ok
livez check passed
tokenはsecretリソースを作成して取得する。
[Kubernetes] ヘルスチェックAPIを試す (bearer token認証付き) - zaki work log
pod
CrashLoopBackOff
describe
またはevent
で
Failed to pull image "quay.io/ansible/awx-operator:0.16.1-12-g768bc2f": rpc error: code = NotFound desc = failed to pull and unpack image "quay.io/ansible/awx-operator:0.16.1-12-g768bc2f": failed to resolve reference "quay.io/ansible/awx-operator:0.16.1-12-g768bc2f": quay.io/ansible/awx-operator:0.16.1-12-g768bc2f: not found
や、
Error: ImagePullBackOff
の場合は、イメージがリポジトリに無い。指定が合ってるか確認。
podのステータスもErrImagePull
になる。
logs
で
standard_init_linux.go:228: exec user process caused: exec format error
の場合、イメージのアーキテクチャと実行環境のアーキテクチャが合ってない。
イメージはamd64だけど実行環境がarm64など。
cronjob
Job/Podの自動削除
CronJobリソースの.spec.successfulJobsHistoryLimit
と.spec.failedJobsHistoryLimit
の値で成功と失敗それぞれの保持数が設定される。
超過分は自動で削除される。
https://kubernetes.io/ja/docs/tasks/job/automated-tasks-with-cron-jobs/#job-history-limit
service
FQCN (A/AAAAレコード)
podからは<service-name>.<namespace-name>.svc.cluster.local
で名前解決できる。
消えないnamespace
kubectl delete ns hoge
が応答無くなりstatusがTerminatingのままになった場合の対処。
kubectl get ns hoge -o json > deletens.json
namespace定義の中から、spec.finalizers["kubernetes"]
の定義を見つけ、中身を空にする。
"spec": {
"finalizers": []
},
最後に編集したファイルをパラメタに、以下コマンドを実行
kubectl replace --raw "/api/v1/namespaces/hoge/finalize" -f deletens.json
これで削除できるはず。
namespaceの定義が簡単な場合は以下コマンドでも行ける。
kubectl get ns ${namespace} -o json | grep -v -- '"kubernetes"' | kubectl replace --raw "/api/v1/namespaces/${namespace}/finalize" -f -
※ kubectl get ns hoge -o json | grep -2 -- '"kubernetes"'
を実行して、1か所しかヒットしない場合
REST
namespace一覧
curl https://k8s.example.org:6443/api/v1/namespaces
NamespaceList
が返る。