CodingTest/Baekjoon

[baekjoon] 백준 1969번(파이썬): DNA

JunJangE 2022. 1. 7. 01:24

문제

 

1969번: DNA

DNA란 어떤 유전물질을 구성하는 분자이다. 이 DNA는 서로 다른 4가지의 뉴클레오티드로 이루어져 있다(Adenine, Thymine, Guanine, Cytosine). 우리는 어떤 DNA의 물질을 표현할 때, 이 DNA를 이루는 뉴클레오

www.acmicpc.net

알고리즘

- 반복문을 통해 서로 다른 4가지의 뉴클레오티드가 몇 개씩 있는지 확인한다.

- 각 행의 열을 확인 후 뉴클레오티드 개수가 제일 많은 걸 찾고 그때의 DNA가 Hamming Distance의 합이 가장 작은 DNA가 된다.

- 사전 순으로 정렬하기 위해 A/C/G/T순으로 확인한다.

- DNA는 뉴클레오티드 개수가 제일 많은 것이고 Hamming Distance은 나머지 뉴클레오티드의 개수가 된다. 

코드

import sys

n, m = map(int, sys.stdin.readline().split())
DNA = [list(map(str, sys.stdin.readline().strip())) for _ in range(n)]

res = ""
cnt = 0

# 반복문을 통해 서로 다른 4가지의 뉴클레오티드가 몇 개씩 있는지 확인
for i in range(m):
    DNAs = {"A": 0, "T": 0, "G": 0, "C": 0}

    for j in range(n):
        DNAs[DNA[j][i]] += 1

    # 뉴클레오티드 개수가 제일 많은게 Hamming Distance의 합이 가장 작은 DNA가 된다.
    # 사전순으로 정렬하기 위해 A/C/G/T 순으로 확인
    if max(DNAs["A"], DNAs["T"], DNAs["G"], DNAs["C"]) == DNAs["A"]:
        res += "A" # DNA
        cnt += DNAs["T"] + DNAs["G"] + DNAs["C"] # Hamming Distance

    elif max(DNAs["A"], DNAs["T"], DNAs["G"], DNAs["C"]) == DNAs["C"]:
        res += "C"
        cnt += DNAs["A"] + DNAs["T"] + DNAs["G"]

    elif max(DNAs["A"], DNAs["T"], DNAs["G"], DNAs["C"]) == DNAs["G"]:
        res += "G"
        cnt += DNAs["A"] + DNAs["T"] + DNAs["C"]

    elif max(DNAs["A"], DNAs["T"], DNAs["G"], DNAs["C"]) == DNAs["T"]:
        res += "T"
        cnt += DNAs["A"] + DNAs["G"] + DNAs["C"]


print(res)
print(cnt)

github

 

GitHub - junjange/CodingTest: 내가 푼 코딩 테스트 문제와 해결법

내가 푼 코딩 테스트 문제와 해결법. Contribute to junjange/CodingTest development by creating an account on GitHub.

github.com