본문 바로가기
Sketch (Programming Language)/Python

프로그래머스 - 연속된 부분 수열의 합

by 생각하는 이상훈 2024. 5. 20.
728x90

문제

비내림차순으로 정렬된 수열이 주어질 때, 다음 조건을 만족하는 부분 수열을 찾으려고 합니다.

  • 기존 수열에서 임의의 두 인덱스의 원소와 그 사이의 원소를 모두 포함하는 부분 수열이어야 합니다.
  • 부분 수열의 합은 k입니다.
  • 합이 k인 부분 수열이 여러 개인 경우 길이가 짧은 수열을 찾습니다.
  • 길이가 짧은 수열이 여러 개인 경우 앞쪽(시작 인덱스가 작은)에 나오는 수열을 찾습니다.

수열을 나타내는 정수 배열 sequence와 부분 수열의 합을 나타내는 정수 k가 매개변수로 주어질 때, 위 조건을 만족하는 부분 수열의 시작 인덱스와 마지막 인덱스를 배열에 담아 return 하는 solution 함수를 완성해주세요. 이때 수열의 인덱스는 0부터 시작합니다.

 

입출력 예시

입출력 예 #1

[1, 2, 3, 4, 5]에서 합이 7인 연속된 부분 수열은 [3, 4]뿐이므로 해당 수열의 시작 인덱스인 2와 마지막 인덱스 3을 배열에 담아 [2, 3]을 반환합니다.

 

입출력 예 #2

[1, 1, 1, 2, 3, 4, 5]에서 합이 5인 연속된 부분 수열은 [1, 1, 1, 2], [2, 3], [5]가 있습니다. 이 중 [5]의 길이가 제일 짧으므로 해당 수열의 시작 인덱스와 마지막 인덱스를 담은 [6, 6]을 반환합니다.

 

입출력 예 #3

[2, 2, 2, 2, 2]에서 합이 6인 연속된 부분 수열은 [2, 2, 2]로 3가지 경우가 있는데, 길이가 짧은 수열이 여러 개인 경우 앞쪽에 나온 수열을 찾으므로 [0, 2]를 반환합니다.

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

 


풀이

wrong_code.py

def solution(sequence, k):
    ans=[0]*100
    for i in range(len(sequence)):
        for j in range(len(sequence)):
            if sum(sequence[i:j+1]) == k:
                n = len(sequence[i:j+1])
                if n < len(ans):
                    ans = [i, j]
    return ans

처음에는 우선 아무 생각 없이 brute force로 코드를 작성하였다. 이중 포문으로 전수조사를 하여 답을 찾고 길이가 더 짧은 답이 있는 경우에만 갱신하는 방식을 이용했다. 여기서 두가지 문제가 존재했다. 우선 무조건 처음으로 조건을 만족하는 케이스에서 초기화된 ans보다 길이가 짧도록 길이를 100으로 설정하면 충분할거라고 생각했으나 그렇지 않은 예시들이 존재했다. 다음으로 시간초과 문제이다. sum()연산자도 연산량이 많고, 이중 for문도 효율이 너무 떨어지는 방법이었다. 아래는 투 포인터 알고리즘으로 개선한 방법이다.

 

two_pointer.py

def solution(sequence, k):
    start, end = 0, 0
    current_sum = 0
    best_length = float('inf')

    while end < len(sequence):
        current_sum += sequence[end]
        while current_sum >= k and start <= end:
            if current_sum == k:
                if end - start + 1 < best_length:
                    best_length = end - start + 1
                    answer = [start, end]
            current_sum -= sequence[start]
            start += 1
        end += 1

    return answer

투 포인터 알고리즘은 배열이나 리스트에서 두 개의 포인터(index)를 이용하여 특정 조건을 만족하는 요소의 집합을 탐색하는 방법이다. 이 기법은 주로 정렬된 데이터에서 사용되며, 이 문제와 같이 누적합 문제를 푸는데 굉장히 특화되어있다. 부분 수열의 합이 특정 값 `k`에 도달하는 경우를 찾는 문제이므로 사용하기 적합하였다.
코드를 보면 두개의 포인터, start와 end를 사용하여 리스트를 순차적으로 탐색하는 것이다. end 포인터를 증가시키면서 합을 누적하고, 합이 k 이상이 되면 start 포인터를 증가시키면서 합에서 값을 빼준다. 이 과정에서 합이 정확히 k와 일치하고 현재 부분 수열의 길이가 이전에 찾은 부분 수열의 최소 길이보다 짧은 경우, 최소 길이와 정답을 업데이트한다.

추가적으로 answer list에 0을 100개 채우는 방법을 사용하지 않고 best_length를 float('inf')로 설정해주어 100보다 큰 정답이 나오는 케이스에 대한 문제도 방지하였다.


728x90