본문 바로가기

    운영진 평가를 반영한 최종 결과는, 차주 (화)요일 공표예정입니다! 😊

      진행 중인 투표

      종료된 투표

      진행 중인 투표

      종료된 투표

      빈 제목

        팀블로그 멤버

        비멤버

        🔥앗뜨거 실시간🔥

        💬재잘재잘💬

        🖥️코딩🖥️ 몰라도 ⚒️웹크롤링⚒️이 가능해? 리스틀리는 가능!!

        by 김민하 | 숙명여대 | 수학 | SK 2024. 8. 24.
        본 커리큘럼은, 팔랑크스 클럽을 후원하는 실무자 후원회에서 작성/소유하고 있는 사유물로서,
        정식으로 팔랑크스 클럽(동아리)의 절차에 따라, 시즌을 등록한 크루 외에는 제공, 안내되지 않습니다.

        허가되지 않는 배포/재가공/캡처 등이 이루어질 시 관련 법령에 따라
        손해배상 및 저작권 침해 소송을 제기할 수 있으니, 각별히 유의 바랍니다.
        (본 사항은 법령 자문에 따라 '모두' 가 볼 수 있는 명시적 근거를 설립하는 과정임을 재명기합니다.)

        유닛 코드: PXO-202 (선택형)

        유닛명: [기획 tool]리스틀리 : 내가 보고있는 화면의 데이터는?

         

         

        STEP 01 .   리스틀리는 어떻게 활용하는  tool인가요?

         

        1. 설치 https://www.listly.io

        가장 먼저, 링크에 연결된 웹페이지를 통해, 리스틀리를 설치해줍니다!

        오른쪽 상단의 버튼을 통해 확인해주고,

         

        회원가입을 해주겠습니다!!

        (무료기능만 사용하려면 회원가입은 안해도 되는 것 같습니다.

        하핳.. 저는 하고나서 알게되어서… 그냥 했어요!! :> )

         

        2. 기본 동작(검색과 실행)

         

        저는 요즘 관심있는, ‘재생에너지 교육’ 키워드를 검색해보도록 하겠습니다!

         

        해당 키워드와 관련된 뉴스탭을 누르고 리스틀리를 실행시켜 봅니다.

         

        재생에너지 교육에 관한 새로운 뉴스를 확인하다가,

        키워드 분석을 해보고자 리스틀리를 활용해보겠습니다!

        전체로 받아보겠습니다!

         

        3. 결과(추출 데이터와 각 라벨 파악)

         

        이런 식으로 데이터가 받아집니다!

         

        위 데이터를 구글시트와 엑셀의 형태로 다운받을 수도 있습니다!

        저는 구글 시트로 다운받는데, 로그인 이슈가 발생하여 결국 포기하였습니다..

        (로그인했는데도 잘 작동하지 않는 것 같습니다! 원인불명…)

         

        그래서 그냥 엑셀로 다운받기를 했는데!

        라벨이 규칙적으로 받아지지 않네요 :(

         

        그러던 중, 앗!!

        .

        .

        .

         

        데이터가 만료되었다고합니다…

         이럴수가!?!

         

        알고보니, 무료버전은 몇가지 제약이 있었던 것이었습니다…

        (아래 사진에 캡쳐를 해보았습니다! 필요하신 분들께서는 참고하세요!)

         

        리스틀리가 스크랩핑 한 데이터를 바탕으로 각  LABEL은 무엇을 의미하는지 확인해봅니다.

         

        (이후 몇번의 스크래핑을 더 시도해보았으나,

        의미있는 결론이 나오지 않아

        결국 원본 데이터를 수정하여 활용해보도록 하겠습니다…)

         

        받아진 데이터를 활용가능한 수준으로 살리기 위해 몇가지 편집을 좀 해주겠습니다!

        <원본>

        (이게 뭐람)

        .

        .

        .

        .

        .

        .

        <데이터 정제>

        (휴 통계학과로서, 이제야 좀 마음이 편안하군요..)

        => 리스틀리 활용에 여러가지 다른 참고자료들을 봤는데, 그 때 당시와 달라진 것들이 꽤나 있는 것 같습니다! 따라하려고 할 때, 무료/유료버전을 잘 확인해보시고, 꼭 필요한 경우에 자신의 상황에 따라 결제하면 활용도가 더욱 높아질 것 같아요!

         

        STEP 02 . 나는 어떤 데이터를 수집하는 기획자인가요?

         

         

         


        1. 현재 여러분은 어떤 기획자인가요?

        - 저는 ‘에너지’ 업계의 ‘서비스’ 기획자입니다!

         

        2. 현재 여러분이 데이터를 수집하고자 하는 ‘목적’은 무엇인가요?

        - 재생에너지와 관련하여 어떤 교육들이 많이 진행되고 있는지, 트렌드를 파악해보려고합니다!

         

        3. 리스틀리를 통해서 어떤 데이터를 수집하고자 하나요?

        - 현행중인 재생에너지 관련한 교육을 업계에서는 인재양성을 위해 어떻게 설계하고, 활용하는지.

        또, 기업에서는 어떻게 이를 활용하려는지에 관한 정보를 정리해보고자 합니다!

         

         

         

         

         

        STEP 03 . 이 데이터들은 어떻게 활용할 수 있나요?

        1. 내가 활용할 데이터는 무엇인가요?

         

        위의 동일 검색어를 서치하여 나온 검색 결과 뉴스탭의 1페이지부터 5페이지까지의 원본데이터를 규격만 정제하여 나온 데이터를 정리해주었습니다.

         

        흠~ 그런데 저는 검색결과를 통해 동향을 파악하는 것이기 때문에, 각 라벨이 모두 필요하지는 않습니다!

        따라서, 불필요한 데이터를 지워주고,

        라벨4(기사 제목)와 라벨5(기사 원문 첫문장/소제목)만 남겨줍니다.

         

        1. 여러분은 데이터를 어떻게 다루고자 하나요?

        본 데이터를 통해, 어떤 용어가 많이 언급되는지를 확인하고, 트렌드와 현황을 파악하기 위하여 워드 클라우드를 생성 후, 키워드 분석을 해보겠습니다!

         

        2. 여러분은 데이터를 어떻게 다루고자 하나요?

        워드클라우드는 기존에 제가 분석할 때 쓰던 방법을 통해 진행했는데요,

        엑셀로 워드클라우드를 만드는 방법은 아래 링크를 참조할 수 있습니다! :>

        참고 영상: https://www.youtube.com/watch?v=h-R8L9356L0

         

         

        이런 이미지가 생성되었네요! 눈에 띄는 키워드는

        • 신재생에너지
        • 에너지
        • 교육
        • 분야
        • 에코에너지
        • 천안과학산업진흥원
        • 전력시장
        • 연료전지

        입니다.

         

        흠… 새로운 인사이트를 얻기 보다는 본 키워드들을 바탕으로 새로운 자료를 찾아볼 수 있을 것 같아요! :>

         

         

         

        여러분들도 리스틀리를 활용해 성공적인 기획 되시기를 바랍니다!

        다들 파이팅 :>



        댓글

        최신글 전체

        이미지
        제목
        글쓴이
        등록일