ORES deployment finish "successfully" even when uwsgi and celery fail to successfully start up
Closed, ResolvedPublic
Actions

Assigned To

Authored By

	Halfak
	Jul 18 2017, 4:29 PM

Description

$ scap deploy -v T170485
16:21:09 Started deploy [ores/deploy@1d35aa5]
16:21:09 Deploying Rev: 1d35aa5b853f304bb11dd46bc79dfc3660f68ce8
16:21:09 Update DEPLOY_HEAD
16:21:09 Creating /srv/deployment/ores/deploy/.git/DEPLOY_HEAD
Deleted tag 'scap/sync/2017-02-04/0003' (was 7c228c6)
16:21:09 Update server info
Entering 'submodules/draftquality'
Entering 'submodules/editquality'
Entering 'submodules/ores'
Entering 'submodules/wheels'
Entering 'submodules/wikiclass'
16:21:09 Started deploy [ores/deploy@1d35aa5]: T170485
16:21:09 
== WORKER ==
:* deployment-sca03.deployment-prep.eqiad.wmflabs
16:21:09 Running remote deploy cmd ['/usr/bin/scap', 'deploy-local', '-v', '--repo', 'ores/deploy', '-g', 'worker', 'fetch', '--refresh-config']
ores/deploy: fetch stage(s): 100% (ok: 1; fail: 0; left: 0)                     
16:21:12 Running remote deploy cmd ['/usr/bin/scap', 'deploy-local', '-v', '--repo', 'ores/deploy', '-g', 'worker', 'config_deploy', '--refresh-config']
ores/deploy: config_deploy stage(s): 100% (ok: 1; fail: 0; left: 0)             
16:21:13 Running remote deploy cmd ['/usr/bin/scap', 'deploy-local', '-v', '--repo', 'ores/deploy', '-g', 'worker', 'promote', '--refresh-config']
ores/deploy: promote and restart_service stage(s): 100% (ok: 1; fail: 0; left: 0)
16:21:15 
== WORKER ==
:* deployment-sca03.deployment-prep.eqiad.wmflabs
16:21:15 Running remote deploy cmd ['/usr/bin/scap', 'deploy-local', '-v', '--repo', 'ores/deploy', '-g', 'worker', 'finalize', '--refresh-config']
ores/deploy: finalize stage(s): 100% (ok: 1; fail: 0; left: 0)                  
16:21:16 Finished deploy [ores/deploy@1d35aa5]: T170485 (duration: 00m 07s)
16:21:16 Finished deploy [ores/deploy@1d35aa5] (duration: 00m 07s)

But when I logged into deployment-sca03 uwsgi and celery had both failed to restart at all.

Details

	Subject	Repo	Branch	Lines +/-
	Add check for celery service in scap	mediawiki/services/ores/deploy	master	+6 -0

Customize query in gerrit

Related Objects

Mentioned In: T209587: Migrate ores celery configs to celery 4
rORESDEPLOYa51168ddab8b: Add check for celery service in scap
Mentioned Here: T209587: Migrate ores celery configs to celery 4

Event Timeline

Halfak created this task.Jul 18 2017, 4:29 PM

Restricted Application added a subscriber: Aklapper. · View Herald TranscriptJul 18 2017, 4:29 PM

Halfak triaged this task as High priority.Jul 20 2017, 2:50 PM

Halfak moved this task from Unsorted to Maintenance/cleanup on the Machine-Learning-Team board.

Ladsgroup added a project: Scap.Jul 20 2017, 6:28 PM

Ladsgroup claimed this task.Nov 15 2018, 10:13 PM

Ladsgroup edited projects, added Machine-Learning-Team (Active Tasks); removed Machine-Learning-Team.

Restricted Application added a project: User-Ladsgroup. · View Herald TranscriptNov 15 2018, 10:13 PM

Change 474690 had a related patch set uploaded (by Ladsgroup; owner: Ladsgroup):
[mediawiki/services/ores/deploy@master] Add check for celery service in scap

https://gerrit.wikimedia.org/r/474690

gerritbot added a project: Patch-For-Review.Nov 19 2018, 1:50 PM

Ladsgroup moved this task from Parked to Review on the Machine-Learning-Team (Active Tasks) board.Nov 19 2018, 1:50 PM

Ladsgroup mentioned this in rORESDEPLOYa51168ddab8b: Add check for celery service in scap.Nov 19 2018, 1:58 PM

Change 474690 merged by Ladsgroup:
[mediawiki/services/ores/deploy@master] Add check for celery service in scap

https://gerrit.wikimedia.org/r/474690

Mentioned in SAL (#wikimedia-operations) [2018-11-19T15:28:24Z] <ladsgroup@deploy1001> Started deploy [ores/deploy@e957b24]: T209587 T170950

Mentioned in SAL (#wikimedia-operations) [2018-11-19T15:45:33Z] <ladsgroup@deploy1001> Finished deploy [ores/deploy@e957b24]: T209587 T170950 (duration: 17m 09s)

Ladsgroup moved this task from Review to Completed on the Machine-Learning-Team (Active Tasks) board.Nov 19 2018, 3:50 PM

Ladsgroup closed this task as Resolved.Dec 17 2018, 12:39 PM

ORES deployment finish "successfully" even when uwsgi and celery fail to successfully start upClosed, ResolvedPublicActions

Description

Details

Related Objects

Event Timeline

ORES deployment finish "successfully" even when uwsgi and celery fail to successfully start up
Closed, ResolvedPublic
Actions