공부하기싫어

목차

     

    chatGPT 를 이용해 wordpress 블로그를 자동 포스팅 방식으로 운영해보려고 한다.

     

    https://roadmap.sh/prompt-engineering

     

    Prompt Engineering Roadmap - roadmap.sh

    Step by step guide to learn Prompt Engineering. We also have resources and short descriptions attached to the roadmap items so you can get everything you want to learn in one place.

    roadmap.sh

     

    프롬프트 엔지니어링을 공부하던 중 chatGPT 를 이용해 블로그를 운영하려는 시도는 예전부터 있어왔기에

    이 정보들에 대해 사전 조사를 하고 정리해보려고 한다.

     

     

    1. chatGPT 자동 포스팅 여론, 수익성

     

    필자는 ChatGPT 자체를 반대하거나 그것이 유용하지 않다고 생각하지 않습니다. 다만, 이것을 블로그에 끌어들여 ChatGPT로 쉽게 자동글을 만들어 포스팅하는 것을 콘텐츠 삼아 유튜브에 영상을 올린 것에 조금은 충격을 먹었습니다. 그 영상을 보고 그것을 시도하는 사람들이 생겨날까 걱정되기 때문입니다.
     
    그렇게 만들어진 글들로 채워진 블로그는 결코 성공할 수도 없고 높은 조회수도 올릴 수 없습니다. 조회수가 상관없는 블로그라고 할지라도 과연 그러한 글들이 독자들에게 무슨 의미가 있겠으며, 그 블로그가 무슨 필요가 있을까요? 
     
    선택의 각자의 몫이지만, 저는 절대 추천하지 않습니다. 
     
    단언컨데 그렇게 만들어진 글들을 포털들은 다 알고 있습니다. 
    https://namedia.tistory.com/305

     

    chatGPT를 활용하여 콘텐츠를 마음껏 만들자. 누가 만들었든 스팸성 글이 아니라 사용자에게 유용한 정보이면 구글이 노출 시켜 줄 것이다.
    https://neonomadj.com/%EA%B5%AC%EA%B8%80%EC%9D%80-chatgpt%EB%A1%9C-%EC%93%B4-%EA%B8%80%EC%97%90-%EB%B6%88%EC%9D%B4%EC%9D%B5%EC%9D%84-%EC%A4%84%EA%B9%8C-%EB%B8%94%EB%A1%9C%EA%B7%B8-%EC%BD%98%ED%85%90%EC%B8%A0%EB%A5%BC-ai/

     

    이외에 유튜브에도 chatGPT 를 이용한 자동화 포스팅 영상이 많은데 댓글을 보면 거의 다 반응이 좋다

     

    안녕하세요. AI 노마드랩 입니다.

    저는 2020년부터 티스토리 블로그를 운영했고 애드센스로만 8,000만원 가량 벌었습니다.

    매년 2,700만원, 월평균 225만원 정도가 되는군요.

    직장인 평균 월급보다는 부족하지만, 부수입으로는 훌륭하지 않나요?

     

     

    - 요약

    • SEO 에 의해 포스트들의 노출이 관리되고 있다
    • 예전부터 조회수만을 노린 낚시성 포스트들은 이 SEO 에 의해 상단 노출에서 제외되고 이는 수익에 직결된다
    • 근데 포스트의 질이 좋으면 문제 없다
    • 기반 시스템을 잘 갖추나면 수익성도 꽤 좋다

     

    -> 프롬프트 엔지니어링을 통한 양질의 포스팅 필요

     

     

     

     

    2. chatGPT 실시간 데이터 엑세스 불가

    - chatGPT 질의응답

    더보기
    me:
    I want to know what are the most tagged topics on meta, reddit, instagram, tiwtter.
    Show the top 1, 2, and 3 most tagged rankings in the last week on each platform
    
    
    chatGPT:
    I'd be glad to assist you with that information. However, please note that I don't have real-time access to current data since my knowledge was last updated in September 2021. As a result, I can't provide you with the most up-to-date information on the most tagged topics on these platforms for the last week. But I can give you a general idea of how you might find this information:
    
    Meta (formerly Facebook):
    To find the most tagged topics on Meta, you can explore popular groups and pages, as well as monitor trending hashtags. Some common topics that tend to be popular on social media platforms include politics, technology, entertainment, and social issues.
    
    Reddit:
    Reddit has various subreddits (topic-specific communities), and each subreddit might have its own popular topics. To find the most tagged topics, you can visit the "Popular" or "Trending" sections on Reddit or use third-party tools that analyze subreddit data.
    
    Instagram:
    Instagram trends can be tracked by monitoring the Explore page and paying attention to hashtags that are widely used. Instagram often features trending hashtags and topics related to fashion, food, travel, and various challenges.
    
    Twitter:
    Twitter's trending topics can be found on the platform's sidebar. These trends are often accompanied by hashtags and represent the most talked-about subjects. Topics on Twitter can range from breaking news to entertainment events and viral discussions.
    
    To get the most accurate and up-to-date information for the past week, I recommend visiting each platform directly and exploring their trending sections, hashtags, or any available analytics tools. You might also consider using third-party social media monitoring tools that provide insights into trending topics and hashtags on these platforms.
    me:
    https://www.itworld.co.kr/topnews/304555
    Summarize the article in the link above
    
    chatGPT:
    I'm sorry for any misunderstanding, but I don't have the ability to access external links or browse the internet, including accessing specific articles from URLs. As of my last update in September 2021, my knowledge is based on information available up to that point, and I can't provide summaries or information from sources beyond that.
    
    If you could provide the key points, main ideas, or content from the article, I'd be happy to help you summarize or discuss it based on the information you provide.
    me:
    You know you don't have access to real-time data.
    However, if I crawl the data myself and pass it to you as a string, can you use it for analysis?
    
    chatGPT:
    Yes, I can certainly help analyze and generate information based on data you provide in text form. If you crawl relevant data from sources and share that information with me as text, I can assist you in analyzing, summarizing, and discussing the content. Feel free to provide the text or data you have, and I'll do my best to help you with any analysis, summaries, explanations, or writing you need.

     

     

     

    - 요약

    • chatGPT는 21년 9월 에 업데이트된 이후 실시간 데이터에 액세스 할 수 없다. - 크롤링 불가
    • 링크를 통한 수동적 데이터에도 접근 불가
    • 직접 크롤링해온 본문을 요약하거나, 해당 정보를 바탕으로 새로운 컨텐츠 생성은 가능함

    -> 실시간 데이터 수집을 위한 크롤링 함수가 필요할 듯 하다.

     

    3. API 토큰

    - chatGPT 질의응답

    더보기
    me:
    Then, should we understand that one token means one word?
    If I send the question 'i want to know what "hello world" mean' to chatGPT, will I use 8 tokens i, want, to, know, what, hello, world, mean?
    
    chatGPT:
    Tokens do not always correspond directly to one word; they can represent various linguistic units such as words, subwords, or even individual characters. In English text, a token might generally represent a word, but it can also be shorter or longer than a word depending on the context.
    
    In your example, the question "i want to know what 'hello world' means" would likely be split into tokens as you described:
    
    "i"
    "want"
    "to"
    "know"
    "what"
    "'"
    "hello"
    "world"
    "'"
    "mean"
    "s"
    So, your example would consist of 11 tokens. It's important to note that punctuation marks, spaces, and even some individual characters can also count as separate tokens.
    
    When working with OpenAI's GPT-3 models, including GPT-3.5, keeping track of tokens is crucial to ensure that your input stays within the model's token limit. You can use the tiktoken package or similar methods to count the tokens in your input text accurately.

    - chatGPT API token 계산

    https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them

     

    - chatGPT API token 가격

    https://openai.com/pricing

     

    Pricing

    Simple and flexible. Only pay for what you use.

    openai.com

     

     

    - 컨텍스트 제한

    GPT 모델에 따라서 컨텍스트를 기억하는데 한계가 있습니다. ChatGPT를 사용하다보면 AI가 채팅을 하다 이전 대화내용을 까먹거나 할 경우가 생기는것을 확인 하신 경험이 있으실 수 있습니다. 이것은 착각이 아니라 정말로 그런 케이스가 자주발생할 수 있습니다. ChatGPT 3.5 기준으로 ChatGPT는 4097 token 까지 기억할 수 있습니다. 즉 이 이상의 컨텍스트는 대화가 지속되게 되면 잊어버립니다.
    https://sabarada.tistory.com/254
    더보기
    me:
    I know you can only remember information up to the 4097 token in this thread you are talking to.
    If I specify 'information to be remembered' and 'information not to be remembered' to you, can the previously specified 'information to be remembered' be recalled when the conversation continues for more than 4097 tokens?
    
    chatGPT:
    I don't have the ability to remember specific information from one interaction to the next. Each new prompt or message is treated as an independent context, and I can only retain information within the current session, up to the token limit. If the conversation continues beyond 4097 tokens, any information provided earlier in the conversation may not be accessible due to the token limit constraint.

     

    - 요약

    • chatGPT 에게 질문할 때 문자열 길이에 제한이 있다.
    • 이는 프로그램 유지비용과도 직결된다.
    • 한 쓰레드에서 저장해 활용할 수 있는 데이터는 4097 token 이다.

    -> 크롤링해온 데이터를 한번 정제한 후 나온 데이터를 가지고 컨텐츠를 생성하는 식으로 함수를 구성해야 할 듯 하다.

     

     

    4. chatGPT 블로그 컨샙(전략) 

    위에서 조사한 내용을 토대로 이번 프로젝트의 대략적인 컨샙을 정하려고 한다.

    일단 21년 9월에 마지막으로 업데이트되었기 때문에 크롤링을 통해 문자열로 정보를 전달하지 않는다면 chatGPT 는 최신 정보를 대답할 수 없다.

    그렇기 때문에 chatGPT 가 직접 주제를 선정해서 글을 쓰는 것은 질적으로 좋을 수 없다고 판단된다.

     

    크롤링을 통해 정보를 전달하는데도 한계가 있다.

    레딧이나 트위터 등의 sns 에서 크롤링해온다고 할 때, 다수 피드가 사진 안에 텍스트를 넣는 식으로 업로드 되기 때문에 문자열 형식의 크롤링이 불가능할 수 있다.

     

    그래서, 양질의 컨텐츠를 만드는 방법에 대해 생각해봤다.

     

    1. 크롤링을 통해 주제를 선정, 관련된 최근 정보를 모은 후 chatGPT 가 해당 정보를 바탕으로 컨텐츠를 생성

    2. chatGPT 가 새롭게 창조해낼 수 있는 주제로 컨텐츠를 생성

     

     

     

     

     

    참고

    https://namedia.tistory.com/305

     

    ChatGPT 챗GPT로 블로그 작성 절대 하지 마세요.

    최근 ChatGPT가 세계적으로 매우 큰 이슈입니다. 이 인공지능의 신기술의 놀라움에 충격을 먹은 사람들이 적지 않으며, ChatGPT가 마치 인간의 모든 지식을 대변해 줄 수 있을 것만 같은 기사를 쏟아

    namedia.tistory.com

     

    https://neonomadj.com/%EA%B5%AC%EA%B8%80%EC%9D%80-chatgpt%EB%A1%9C-%EC%93%B4-%EA%B8%80%EC%97%90-%EB%B6%88%EC%9D%B4%EC%9D%B5%EC%9D%84-%EC%A4%84%EA%B9%8C-%EB%B8%94%EB%A1%9C%EA%B7%B8-%EC%BD%98%ED%85%90%EC%B8%A0%EB%A5%BC-ai/

     

    구글은 ChatGPT로 쓴 글에 불이익을 줄까? 블로그 콘텐츠를 AI로 발행해도 될까? | Neonomad J

    ChatGPT3가 워낙 좋은 퍼포먼스를 보여주고 있어서 그런지 유튜브에 ChatGPT에 대한 영상이 부쩍 많아졌다. 꽤 전문적인 AI툴 분석 영상에서부터 AI를 이용한 글쓰기나 영상 제작과 같은 콘텐츠 생산,

    neonomadj.com

     

    https://sabarada.tistory.com/254

     

    ChatGPT 알아보기 - Token

    안녕하세요. 오늘은 ChatGPT 시리즈의 마지막으로 ChatGPT에서 Token에 대해서 알아보도록하겠습니다. Token이란 ChatGPT의 기본 단위입니다. 이 Token이라는 단위를 이용해서 가격을 설정하고 이전 대화

    sabarada.tistory.com