프로그래머스(Python)/Level2

[카카오 기출문제] '튜플' 문제 풀이 - Python

Jinomad 2020. 7. 29. 00:57

Contents

  1. 문제 설명

    [제한사항]

    [입출력 예]
  2. 알고리즘 분석 

    [나의 풀이]

    [Most 1 의 풀이]

 

 

문제 설명

 

셀수있는 수량의 순서있는 열거 또는 어떤 순서를 따르는 요소들의 모음을 튜플(tuple)이라고 합니다. n개의 요소를 가진 튜플을 n-튜플(n-tuple)이라고 하며, 다음과 같이 표현할 수 있습니다.

  • (a1, a2, a3, ..., an)

튜플은 다음과 같은 성질을 가지고 있습니다.

  1. 중복된 원소가 있을 수 있습니다. ex : (2, 3, 1, 2)
  2. 원소에 정해진 순서가 있으며, 원소의 순서가 다르면 서로 다른 튜플입니다. ex : (1, 2, 3) ≠ (1, 3, 2)
  3. 튜플의 원소 개수는 유한합니다.

원소의 개수가 n개이고, 중복되는 원소가 없는 튜플 (a1, a2, a3, ..., an)이 주어질 때(단, a1, a2, ..., an은 자연수), 이는 다음과 같이 집합 기호 '{', '}'를 이용해 표현할 수 있습니다.

  • {{a1}, {a1, a2}, {a1, a2, a3}, {a1, a2, a3, a4}, ... {a1, a2, a3, a4, ..., an}}

예를 들어 튜플이 (2, 1, 3, 4)인 경우 이는

  • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}

와 같이 표현할 수 있습니다. 이때, 집합은 원소의 순서가 바뀌어도 상관없으므로

  • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}
  • {{2, 1, 3, 4}, {2}, {2, 1, 3}, {2, 1}}
  • {{1, 2, 3}, {2, 1}, {1, 2, 4, 3}, {2}}

는 모두 같은 튜플 (2, 1, 3, 4)를 나타냅니다.

특정 튜플을 표현하는 집합이 담긴 문자열 s가 매개변수로 주어질 때, s가 표현하는 튜플을 배열에 담아 return 하도록 solution 함수를 완성해주세요.

 

 

 

 

 

 

제한사항

  • s의 길이는 5 이상 1,000,000 이하입니다.
  • s는 숫자와 '{', '}', ',' 로만 이루어져 있습니다.
  • 숫자가 0으로 시작하는 경우는 없습니다.
  • s는 항상 중복되는 원소가 없는 튜플을 올바르게 표현하고 있습니다.
  • s가 표현하는 튜플의 원소는 1 이상 100,000 이하인 자연수입니다.
  • return 하는 배열의 길이가 1 이상 500 이하인 경우만 입력으로 주어집니다.

 

 

 

 

 

입출력 예

s result
"{{2},{2,1},{2,1,3},{2,1,3,4}}" [2, 1, 3, 4]
"{{1,2,3},{2,1},{1,2,4,3},{2}}" [2, 1, 3, 4]
"{{20,111},{111}}" [111, 20]
"{{123}}" [123]
"{{4,2,3},{3},{2,3,4,1},{2,3}}" [3, 2, 4, 1]

 



 

 

알고리즘 분석

 

  • 나의 풀이
def arrange(s): # 's'를 리스트로 바꾸어 반환하는 함수 
    s = s[1:-1] + ',' # 앞뒤의 중괄호를 제거하고 리스트로 변환하는 과정에서 필요한 ','를 마지막에 추가
    new_arr = [] # 새로 재정립하기 위한 리스트 

    for str in s:
        if str == '{': # '{'일 경우 
            str_tmp, tmp = '', [] # 필요한 문자열과 리스트를 초기화
        elif str == '}': # 
            new_arr.append(tmp)
        elif str.isdigit(): # 문자 요소가 숫자일 경우 
            str_tmp += str # 숫자를 담는 str_tmp에 str을 추가 
        else: # 이외 ','일 경우 
            tmp.append(int(str_tmp)) # tmp에 str_tmp를 int형으로 추가 
            str_tmp = '' # str_tmp는 초기화 
    return new_arr

def solution(s):
    answer = []
    s = sorted(arrange(s), key=lambda x: len(x)) # 길이를 기준으로 s를 정렬한다. 
    for arr in s:
        for element in arr:
            if not element in answer: # answer 안에 element가 없을 경우 
                 answer.append(element) # answer에 elment를 추가한다. 
    return answer

 

원래 정규표현식을 이용하려고 했지만, 정규표현식으로 표현할 방법을 몰라서 함수로 구현했다. 정규표현식을 제대로 쓸수 있었으면 더 간단했을텐데.... 

 

위의 코드는 약간 뽀록으로 푼것같다. 문자열 마지막에 ','을 추가했을 때 성공했는데 코드를 분석하다 보니 이해할수 없는 부분이 있었다. 뭐 어쨌든 풀었으니까 만사 OK

 

아니나다를까 Most 1의 코드는 정규표현식을 사용했다. 

 

 

  • Most 1의 풀이
import re
from collections import Counter
def solution(s):
    s = Counter(re.findall('\d+', s))
    return list(map(int, [k for k, v in sorted(s.items(), key=lambda x: x[1], reverse=True)]))

 

Most 1의 코드라 그런지 훨씬 깔끔하고 간단하다. 

 

이 코드를 보기 전에는 주어진 문자열에서 중괄호와 콤마를 어떻게든 처리하고나서 문제를 풀려고 했는데 그럴 필요가 없다는걸 깨달았다. 

 

이 문제는 '튜플의 길이가 짧은 것'부터 처리해야 문제를 쉽게 풀수 있다. 

 

근데 문자열에서 숫자만 추출했을 때, '개수가 적은 순서'대로 처리하는 것도 '튜플의 길이가 짧은 것'과 동일하다. 

 

# s = "{{2},{2,1},{2,1,3},{2,1,3,4}}"
# Counter(re.findall(' Counter(re.findall('\d+', s))  일 경우 

Counter({'2': 4, '1': 3, '3': 2, '4': 1}) 이므로 개수가 많은 순서대로 정렬하면

[2, 1, 3, 4] 가 된다.

 

 때문에 Counter로 숫자의 개수들을 추출하여, 개수가 많은 순서대로 리스트에 추가하면 문제를 해결할 수 있다. 

 


s.item() : Counter는 Counter라는 자료형을 갖는데, item으로 그 안의 내용을 불러올수있다. 

ex) dict_items([('2', 4), ('1', 3), ('3', 2), ('4', 1)])

sorted(정렬대상, key=, reverse=True) : sorted 내에서의 'key='는 정렬의 기준을 정의할 때 사용한다. 예를 들면 

key=lambda x: x[1] 는 정렬대상의 요소 x의 2번째 요소(x[1])를 기준으로 정렬하겠다는 뜻이다. 

또한 기본적으로 오름차순으로 정렬하는데 reverse=True를 통해 내림차순으로 정렬하겠다는 요청을 했다.