With Great Data Comes With Great Responsibility – Intermediate Korean Reading #7 Part 2

Korean Only

With English

세상에서 구글을 가장 안 쓰는 나라가 있습니다. 대한민국입니다. 2015년 1월 기준으로 구글의 PC 검색 점유율은 1.54%입니다. 2%가 안 됩니다. 모바일로 와도 사정은 비슷합니다. 12%가 안 되는 상황입니다. 미국에서는 75% 정도 되고, 유럽 일부 국가에서는 90% 가까이 되는 점유율을 생각하면 너무 낮은 수치입니다.

There is a nation that uses Google least. It is Korea. By the statistics in January, 2015, the search market share of Google in PC is 1.54%. It is less than 2 percent. If we see the mobile world, the situation is not different. It is less than 12%. Compared to 75% in the US and near 90% market share in some European countries, the number is too low.

  • 기준: principle, standard
    • 기준으로: As of
  • 검색: search
  • 점유율: market share
  • 모바일: mobile
  • 일부: some part, partiality
  • 수치: number

구글과 관련한 이런 우스갯소리가 있습니다.

Related to Google, there is a humor like this.

  • 우스갯소리: humor
    • Koreans use the word, humor, as 유머, too.

우리는 사람들이 구글을 왜 사용하는지 연구해 보았다. 그리고 다음과 같은 결론을 내렸다.
사람들이 구글을 쓰는 이유: 검색이 잘 되서
사람들이 구글을 쓰지 않는 이유: 검색이 안 되서

We researched why people use Google, and we concluded like below:
Why people use Google: It searches well.
Why people don't use Google: It searches bad.

  • 연구: research
  • 결론을 내리다: to conclude

너무 당연한 이야기이지만, 한국에서 이렇게 구글이 굴욕을 당하는 이유를 알 수 있습니다. 한국어로는 검색이 잘 안 되기 때문입니다. 네이버가 구입한 전문 자료와 카페, 지식iN, 네이버 캐스트 등에서 생산한 자료는 네이버에서만 검색이 가능합니다. 그래서 네이버가 초반에 검색할 문서가 없어서 생긴 문제를 구글은 지금 겪고 있습니다. 구글은 이에 대해 "일부 사이트들이 검색을 제한하는데 이는 웹의 개방정신에 어긋나는 것"이라며 우회적으로 비판하고 있지만, 네이버는 "페이스북도 공개하지 않는다"라고 답변할 뿐입니다.

It is too obvious, but we can see why Google is humiliated like this in Korea, because they don't search well in Korean. The professional materials Naver bought and the posts produced in Café, 지식iN, Navercast can be searched in Naver only. Google is now under the problem of scarce data that Naver had to solve in its early days. Google indirectly criticizes this policy by telling "some sites restrict the search and it is against the openness of web," but Naver answers "Facebook doesn't open, too."

  • 당연하다: obvious
  • 굴욕을 당하다: to be humiliated
  • 제한하다: restrict
  • 개방: openness
  • 정신: mindset
  • 어긋나다: wrong

이렇게 자료를 수집해 구글을 크게 따돌리고 있지만, 그들이 너무 많은 자료를 모으다 보니 생긴 문제도 많습니다. 일명 펌로그 문제라고 불리는 저작권 문제입니다. 내가 힘들게 쓴 글을 어떤 사람이 자기 사이트에 복사해 올렸는데, 네이버 검색 결과에 내 글보다 남이 복사한 글이 위에 올라온다면 기분이 안 좋을 것입니다. 이렇게 글을 통째로 가져가는 것을 퍼 간다라고 이야기 하며, 그리고 퍼간 글을 많이 모아 놓는 블로그를 펌로그라고 합니다. 이 문제를 네이버도 인식하고 있고, 해결하기 위한 알고리즘도 계속 연구 발전시켜 나가고 있습니다. 다만 이로 인해서 네이버 검색 결과는 별로 신뢰할만하지 못하다는 생각이 많은 사람들 사이에 널리 퍼져 있습니다.

Naver made itself unreachable from Google by collecting data, but some problems rose because they have too much data. It is the copyright problem also known as 펌로그 problem. If someone copied your blog posts that you wrote with a lot of efforts to his own website and the copy were on the upper rank than yours in Naver search, it would make you feel bad. It is called "퍼 가다" to copy the whole web page, and the blogs that have a lot of these complete copies are called 펌로그. Naver knows this problem and they are now researching and improving algorithms to solve this problem. Thanks to that, however, the idea that the search result of Naver is not reliable is prevalent between many people.

  • 일명: also known as
  • 펌로그(=펌 + 로그): blogs that contain a lot of the copied posts.
  • 통째로: whole
  • 퍼: the variant of 푸다(ladle, spoon). It is an example of irregular verb.
  • 인식하다: know
  • 발전: improve
  • 널리 퍼져 있다: prevalent

언론사들과의 사이도 좋지 않습니다. 구글 뉴스의 경우에는 구글의 링크를 통해, 사용자가 신문사 사이트로 이동하는 구조이지만, 네이버에서는 많은 경우 네이버 뉴스에서 기사를 보게 되고, 그 아래 댓글을 달게 됩니다. 열심히 기사를 썼지만, 자신들의 사이트로는 들어오는 것이 거의 없다 보니, 언론사들은 불만이 아주 많습니다. 가끔은 일부러 불만이 섞인 기사를 내 보낸다는 느낌을 줄 정도입니다.

Naver doesn't get along well with newspaper companies. In the case of Google news, the user goes to the website of the newspapers by links, but in Naver, users read news articles in Naver News and comment below it. Reporters tried their best to write those articles, but they get almost nothing from them, so they have a lot of complaints. Sometimes, it looks a bit suspicious that they intentionally send out complaining articles.

  • 기사: article
  • 열심히: diligently, zealously, enthusiastically

또한 뉴스 댓글들 중에는 내용상 문제를 일으킬 소지가 있는 경우도 많아서, 수백명 이상의 사람들을 고용해 그 댓글들에 문제가 없는지 감시하고 있습니다. 뉴스를 수집했기 때문에 생기는 비용이기도 합니다.

In addition, there are some comments that can cause some problems, so Naver hired more than hundreds of people to check the problems in the comments. It is an expenditure because they collected news.

  • 고용하다: hire
  • 감시: monitor, check
  • 수집: collect
  • 비용: expenditure

네이버가 자료를 모으는 것을 좋아하고, 그 자료들을 통해 성장했지만, 그 자료들이 권력이 되어 사회에 악영향을 줄 수 있다 보니 모은 자료에서 안 좋은 자료를 걸러내고 없애는 일이 네이버가 부담해야 할 사회적 책임이 되어 버렸습니다. 큰 힘에도 큰 책임이 따르지만, 큰 데이터에도 큰 책임이 따른다는 것을 보여줍니다.

Naver loves hoarding data and grows up with them, but the data became a power and they can cause some significantly bad impact on the society, so it became Naver's social responsibility to distinguish bad data from good data and destroy them. As with great power comes great responsibility, with great data comes great responsibility, too.

  • 권력: power
  • 걸러내다: filter
  • 사회적 책임: social responsibility

Practice

널리 퍼져 있다 Prevalent

  • The idea is prevalent between people that you can be rich if you study hard.
  • It is almost impossible to change the prevalent misunderstanding.
  • We have to stop the spread of that wrong knowledge.

Possible Answers

  • 열심히 공부하면 잘 살 수 있다는 생각이 사람들 사이에 널리 퍼져 있다.
  • 널리 퍼져 있는 잘못된 생각을 바로잡는 것은 거의 불가능하지.
  • 그런 잘못된 상식이 널리 퍼지는 것을 막아야 해.