Amazon S3

  1. hail-all-spark.jar 파일을 다운로드 받습니다.

AWS Glue 4.0 버전 Docker image에서 설치한 Hail version 0.2.130 로부터 추출한 JAR 파일입니다. (참고)

  1. Amazon S3 서비스로 접속해서 앞에서 다운로드 받은 hail-all-spark.jar 파일을 본인에 알맞은 버킷에 업로드합니다.

Screenshot 2024-03-29 at 10.55.44 AM.png

Screenshot 2024-03-29 at 10.57.36 AM.png

Screenshot 2024-03-29 at 11.07.53 AM.png

  1. 업로드한 hail-all-spark.jar 파일을 선택하고 Copy S3 URL을 눌러 주소를 기록 해놓습니다. 이 복사된 주소는 다음 섹션에서 다룰 AWS Glue의 노트북 작업 코드에 필요합니다.

AWS Identity and Access Management (IAM)

IAM 서비스로 진입하여 정의된 Role 을 수정합니다. GenomicsAnalysis-Genomics-JobRole-* 으로 검색하여 나오는 Role에 대해서 2가지 Policy를 추가할 것입니다.

Screenshot 2024-03-28 at 11.46.41 PM.png

GetRole, PassRole

  1. Create inline policy 를 클릭합니다.

Screenshot 2024-03-29 at 12.03.10 AM.png

  1. 다음과 같이 Policy를 JSON을 선택해서 작성합니다. 이때 반드시 {account-id}는 본인의 AWS Account ID와 {GenomicsAnalysis-Genomics-JobRole-*}은 해당되는 것으로 변경해서 작성합니다.

이때 본인의 AWS Account ID는 콘솔 웹페이지 우측 상단을 클릭해서 Account ID 항목을 통해 확인할 수 있습니다.

{
	"Version": "2012-10-17",
	"Statement": [
		{
			"Sid": "Statement1",
			"Effect": "Allow",
			"Action": [
				"iam:GetRole",
				"iam:PassRole"
			],
			"Resource": [
				"arn:aws:iam::**{account-id}**:role/**{GenomicsAnalysis-Genomics-JobRole-*}**"
			]
		}
	]
}

Screenshot 2024-03-29 at 12.01.57 AM.png

  1. 작성한 커스텀 정책의 이름을 입력하고 Create policy를 클릭합니다.

Screenshot 2024-03-29 at 12.01.36 AM.png