Статистик мэдээлэлд дүн шинжилгээ хийх аргуудын тойм. Гаригууд - аварга том

ABC шинжилгээний талаар дэлгэрэнгүй мэдээллийг илгээнэ үү, бид 1С дахь эсрэг талуудын асар том мэдээллийн сантай. ABC шинжилгээг хэрхэн зөв, чадварлаг хийх вэ?

Хариулт

Павел Боровков,

Consulting Firm Partners компанийн ерөнхий захирал, Боровков

ABC шинжилгээний системийг хэрэгжүүлэх бидний туршлагаас харахад олон компаниудын нягтлан бодох бүртгэлийн суурь үүнд тааруухан бэлтгэгдсэн байдаг. үр дүнтэй хэрэгжүүлэх. Жишээлбэл, 1С нягтлан бодох бүртгэл эсвэл үйл ажиллагааны нягтлан бодох бүртгэлийн мэдээллийн санд "ердийн" лавлах "Харилцагч талууд" ямар харагддаг вэ?

Үүнээс та дараахь зүйлийг харж болно.

Сарын шилдэг нийтлэл

Бид дараах нийтлэлийг бэлтгэсэн.

✩Хяналтын программууд нь компанийг хулгайгаас хамгаалахад хэрхэн тусалж байгааг харуулах;

✩ менежерүүд ажлын цагаар юу хийдэгийг танд хэлэх;

✩Хууль зөрчихгүйн тулд ажилчдын хяналтыг хэрхэн зохион байгуулах талаар тайлбарлана.

Санал болгож буй хэрэгслүүдийн тусламжтайгаар та урам зоригийг бууруулахгүйгээр менежерүүдийг хянах боломжтой болно.

  1. Үйлчлүүлэгчид, ханган нийлүүлэгчид, банкууд, төрийн агентлагууд гэх мэт төрлөөр нь тодорхой ангилдаггүй боловч дур зоргоороо хавтас болгон байрлуулсан: "Хуучин" ба "Шинэ", "Менежер Петровын үйлчлүүлэгчид", "БҮҮ устга! ”, “Нийлүүлэгч Ромашка ХХК гэх мэт.
  2. Худалдан авагч болон ханган нийлүүлэгчийн үүрэг гүйцэтгэдэг сөрөг талууд давхардсан (заримдаа хоёроос илүү удаа давтагддаг).
  3. Зарим хуулийн этгээдүүд хэд хэдэн удаа байгуулагдсан, зарим нь ижил нэртэй, бусад нь хэд хэдэн үсгээр ялгаатай, хаа нэгтээ TIN болон KPP-ийг зааж өгсөн боловч өөр газар байдаггүй.

Дараах тохиолдолд нөхцөл байдал улам дорддог.

  1. Бүртгэлээ тусад нь мэдээллийн сан, лавлах санд хөтөлж, дараа нь тэдгээрийг нэг репозитор болгон нэгтгэдэг компаниудын нэгдсэн (илүү зөв бол "нэгдсэн") мэдээллийн сангийн тухай бид ярьж байна.
  2. Нэг хувилбарын мэдээллийн сангаас илүү дэвшилтэт хувилбар руу шилжсэн бөгөөд хуучин мэдээллийн санд өгөгдөл хадгалах дүрмийг шинэ мэдээллийн сангийн дүрэмд давхардсан.
  3. Ачилгааг үйл ажиллагааны нягтлан бодох бүртгэлийн мэдээллийн санд бүртгэж, төлбөр, харилцан өрийг нягтлан бодох бүртгэлийн мэдээллийн санд хадгалдаг бөгөөд тэдгээрийн хооронд солилцоо байдаг боловч бүрэн бус байна.
  4. Дээрээс нь мэдээж дээр дурдсан бүх тохиолдлуудын хослолууд. Үүний үр дүнд үйлчлүүлэгчид болон борлуулалтыг зөв эрэмбэлсэн ABC шинжилгээний харааны тайланг авах нь бараг боломжгүй юм.

1С мэдээллийн сан нь ABC шинжилгээг үр дүнтэй хийх боломжийг олгохын тулд хийх ёстой алхамуудыг харцгаая.

  1. Эсрэг талуудын лавлахыг бүхэлд нь хөтлөх нэгдсэн дүрмийг хэрэгжүүлэх хуулийн этгээдболон тэдгээрийн бүх суурь (үйл ажиллагааны, нягтлан бодох бүртгэл, төсөв ба CRM - хэрэв тэд тусдаа байвал). Дараахь дүрмийг заавал дагаж мөрдөх ёстой: a. Харилцагч талуудаа тодорхой төрлөөр нь бүлэглэж, бүх үйлчлүүлэгчдийг нэг бүлэгт оруулаарай. б. Хэрэв эсрэг тал нь худалдан авагч, ханган нийлүүлэгчийн үүрэг гүйцэтгэдэг бол аль гүйлгээ (борлуулалт эсвэл худалдан авалт) таны хувьд илүү ач холбогдолтой болохыг тодорхойлж, зохих бүлэгт ангил. Битгий давхардуулаарай! в. Өгөгдлийн санд тодорхой эсрэг талын нэгээс олон удаа оруулахыг хориглоно - зөвхөн өвөрмөц оруулгууд.
  2. "Харилцагч талуудын гэрээ", "Харилцагч талуудын захиалга", "Төслүүд", "Харилцагч талуудын холбоо барих хүмүүс" гэсэн лавлахуудтай ижил төстэй зохицуулалтыг хийж, тэдгээрийн хүрээнд дүн шинжилгээ хийж болно.
  3. ABC шинжилгээ хийх аргыг шийднэ үү. Юуны өмнө: a. Төлбөр эсвэл тээвэрлэлтээр энэ шинжилгээний зорилгоор борлуулалтыг тоол. Магадгүй эдгээр нь зарим тодорхой үзүүлэлтүүд байх болно: борлуулалтын тоо (мөн дүн биш), дундаж авлага эсвэл өөр зүйл; б. Аналитикийн тодорхойлолт (Гэрээлэгч, Гэрээ, Захиалга гэх мэт) нь шинжилгээний гол түлхүүр болно. в. Хуваалцахад ямар босго хэрэглэхийг тодорхойл. Сонгодог нь 80% (A), 15% (B) ба 5% (C) боловч та өөрийн хязгаарыг тогтоож болно. Энэ тохиолдолд үндэслэлийг ойлгох нь зүйтэй болов уу - яг яагаад. Анхны өгөгдлийн бүтэц, шинжилгээний аргыг тодруулсны дараа та техник рүү шилжиж болно - тодорхой 1С тохиргоонд тайлан авах.

Дараах сонголтуудыг эндээс авах боломжтой.

  1. Хэрэв та нягтлан бодох бүртгэлийн үйл ажиллагааны өгөгдөлд тулгуурладаг бол (жишээлбэл, "1С: Худалдааны менежмент" тохиргоонд) ийм бүтээгдэхүүнүүд өөрсдийн "ABC Борлуулалтын шинжилгээ" гэсэн стандарт тайлантай бөгөөд та босго утга болон хэд хэдэн параметрүүдийг тохируулах боломжтой. бусад параметрүүд, дараа нь бэлэн үр дүнг авах.
  2. Нягтлан бодох бүртгэлийн баазыг ашиглах тохиолдолд (жишээлбэл, "1С: Аж ахуйн нэгжийн нягтлан бодох бүртгэл" тохиргоо) 51 ("төлбөрөөр" дүн шинжилгээ хийх үед) эсвэл 90 ("тээврээр" дүн шинжилгээ хийх үед) дансны балансыг авах нь дээр. ), үр дүнг Excel-д байршуулж, дараа нь үүн дээр дүн шинжилгээ хийх.
  3. Хэрэв танд удирдлагын дэвшилтэт тохиргоо байгаа бол (жишээлбэл, "Инталев: Корпорацийн менежмент") та өөрийн бизнесийн онцлогийг харгалзан ямар ч төрлийн ABC шинжилгээг уян хатан байдлаар тохируулах боломжтой: аливаа шинжээч, өөр өөр босго утгатай, диаграмм, диаграмм. Энэ нь дүн шинжилгээ хийх бэлтгэл, тайлангийн маягтыг хүлээн авч дуусгана. Цаашилбал, үйлчлүүлэгч бүртэй цаашдын бизнесийн талаар шийдвэр гаргах шаардлагатай бөгөөд түүний аль хэсэгт багтсанаас хамаарч: хэнтэй хамтын ажиллагаагаа хөгжүүлэх, хэнтэй "зогсоол" горимд шилжүүлэх, хэнтэй хамтын ажиллагаагаа дуусгах талаар шийдвэр гаргах шаардлагатай.

Сергей Корякин,

"Альянс Консалтинг" Нягтлан бодох бүртгэлийн системийг бий болгох газрын захирал

Энгийнээр хэлбэл, ABC / XYZ шинжилгээ нь компанийн нөөцийг ач холбогдлоор нь ангилах боломжийг олгодог. Ихэнхдээ өгөгдсөн төрөлдүн шинжилгээ, ангиллыг барааны жагсаалт болон эсрэг талуудад хэрэглэнэ. Энэхүү шинжилгээний онцлог нь өгөгдлийн массивыг томруулсан ангилалд хуваахыг илэрхийлдэг тул компанид нэр томъёо, эсрэг талуудын том, жижиг жагсаалт байх нь тийм ч чухал биш юм.

1С компанийн үйл ажиллагааны нягтлан бодох бүртгэлийн ихэнх системүүд нь ABC / XYZ ангилал, дүн шинжилгээ хийх боломжийг олгодог. Нэршлийн жишээг ашиглан энэ ангиллын зарчмыг тайлбарлах нь хамгийн хялбар юм.

Тухайн компанийн ABC / XYZ ангиллыг ашиглах нь дараахь ажлуудыг шийдвэрлэх боломжийг танд олгоно.

  • барааны эргэлт, зардлын тогтвортой байдалд дүн шинжилгээ хийх;
  • барааны эргэлтийг сайжруулах;
  • материаллаг нөөцийн хомсдолыг арилгах;
  • барааны нөөцийг тооцоолох;
  • бараа худалдан авах, хадгалахад зориулсан аж ахуйн нэгжийн зардлыг бууруулах;
  • хэрэгцээг багасгах эргэлтийн хөрөнгө;
  • нэмэлт худалдан авалтыг урьдчилан таамаглах.

ABC ангилал нь бүх барааг гурван ангилалд хуваах боломжийг олгодог: А ангиллын бараа - борлуулалтын хэмжээ ихтэй; В ангиллын бараа - илүү дунд зэргийн борлуулалттай; С зэрэглэлийн бараа нь хамгийн бага алдартай.

XYZ-шинжилгээний гол санаа нь объектуудыг шинжилж буй параметрүүдийн нэгэн төрлийн байдлын дагуу (хувилбарын коэффициентийн дагуу) бүлэглэх явдал юм. Энэ аргын хувьд та дүн шинжилгээ хийх параметрийг сонгох хэрэгтэй (жишээлбэл, борлуулсан барааны тоо), судлах хугацаа, хугацааг тодорхойлох хэрэгтэй. Сарын тэмдгийн тоо их байх тусам үр дүн нь илчлэх нь чухал юм. Энэ тохиолдолд тухайн хугацаа нь компанид баталсан төлөвлөлтийн хүрээнээс багагүй байх ёстой.

Шинжилгээний үр дүнд бүх барааг сонгосон параметрийн дагуу гурван ангиллын аль нэгэнд хуваарилна: X анги, Y анги, Z анги. Хэрэв зарагдсан барааны тоо хэмжээний үзүүлэлтийг параметр болгон сонгосон бол ангиллыг дараах байдлаар тайлбарлаж болно: X ангилал - эдгээр нь дүн шинжилгээ хийсэн хугацаанд тогтмол зарагддаг бараа юм; Y-ангилал нь тогтвортой борлуулалт багатай, Z-ангилал нь ховор зарагддаг бараа юм.

Хэрэв ABC болон XYZ шинжилгээний үр дүнг нэгтгэвэл есөн бүлгийн шинжилгээний объектыг олж авна. Тэдгээрийг эцсийн үр дүнд үзүүлэх нөлөөллийн зэрэг (ABC) ба энэ үр дүнгийн тогтвортой байдал / урьдчилан таамаглах чадвар (XYZ) гэсэн хоёр шалгуурын дагуу бүлэглэнэ.

Тухайн зүйлийн ABC / XYZ ангилал нь барааг дараах бүлгүүдэд хуваах боломжийг олгоно.

  • AX, BX - бараа нь өндөр эргэлт, тогтвортой байдалаар тодорхойлогддог. Тэдний байнгын бэлэн байдлыг хангах шаардлагатай боловч үүний тулд аюулгүй байдлын илүүдэл нөөцийг бий болгох шаардлагагүй. Эдгээр бүлгийн барааны хэрэглээ тогтвортой бөгөөд сайн таамаглаж байна.
  • AY, BY - өндөр эргэлттэй эдгээр бүлгийн бараа нь хэрэглээний тогтвортой байдал хангалтгүй байна. Үүний үр дүнд байнгын бэлэн байдлыг хангахын тулд аюулгүй байдлын нөөцийг нэмэгдүүлэх шаардлагатай.
  • AZ, BZ - өндөр эргэлттэй эдгээр бүлгийн бараа нь хэрэглээний таамаглал багатай байдаг. Зөвхөн илүүдэл аюулгүй байдлын улмаас эдгээр бүлгийн бүх барааны баталгаатай бэлэн байдлыг хангах оролдлого нь дундаж бараа материаларилжааны аж ахуйн нэгж ихээхэн нэмэгдэнэ.
  • Энэ бүлгийн CX бүтээгдэхүүнүүд нь эргэлт багатай боловч хэрэглээний өндөр тогтвортой байдалаар тодорхойлогддог. Ийм барааны хувьд та тогтмол давтамжтай захиалгын системийг ашиглаж болно.
  • Энэ бүлгийн CY бүтээгдэхүүн нь эргэлт багатай, хэрэглээний тогтвортой байдал багатай байдаг. Ийм барааны хувьд та захиалгын тогтмол хэмжээ (эзэлхүүн) бүхий захиалгын системийг ашиглаж болно, гэхдээ нэгэн зэрэг худалдааны компанийн санхүүгийн чадавхид үндэслэн даатгалын хувьцааг бүрдүүлж болно.
  • CZ, энэ бүлэгт бүх шинэ бүтээгдэхүүн, байнгын бус эрэлт хэрэгцээтэй, захиалгаар хүргэгдсэн бараа гэх мэт орно. Тэдгээрийн заримыг нэр төрлөөс нь өвдөлтгүй гаргаж авах боломжтой, нөгөө хэсгийг нь байнга хянаж байх ёстой, учир нь энэ нь тухайн бараанаас гардаг. хөрвөх чадваргүй буюу борлогдоход хэцүү хувьцаанууд үүсдэг бүлэг, үүнээс болж арилжааны аж ахуйн нэгжалдагдал хүлээдэг.

Нэршлийн ABC / XYZ ангиллыг хийхдээ дараахь үе шатуудад хувааж болно.

  • ABC/XYZ ангиллын параметрүүдийг тохируулах,
  • нэр томъёоны ABC-ангиллын хэрэгжилт,
  • нэршлийн XYZ-ангиллын гүйцэтгэл;
  • ABC/XYZ нэршлийн шинжилгээ.

ABC болон XYZ-ийн эсрэг талуудыг ижил төстэй байдлаар ангилдаг. Жишээлбэл, та худалдан авагчдад бараа борлуулсан тухай мэдээлэлд дүн шинжилгээ хийсний үндсэн дээр тодорхой хугацаанд дүн шинжилгээ хийж болно: орлого, ашиг, борлуулалтын дууссан баримт бичгийн тоо. Үйлчлүүлэгчдийн ABC ба XYZ ангиллыг гүйцэтгэх параметрүүдийг нягтлан бодох бүртгэлийн параметрийн тохиргоонд тохируулсан болно. Үйлчлүүлэгч бүрийн хувьд та үйлчлүүлэгчийн ангиллын ABC ба XYZ үзүүлэлтүүдийн өөрчлөлтийн динамикийг харж болно. Үйлчлүүлэгчийн баазыг шинжлэхийн тулд ерөнхий өгөгдлийг холбогдох тайлангаас харж болно.

1С нягтлан бодох бүртгэлийн системд стандарт хэрэгслүүдээс гадна "нэмэлт шинж чанарууд" гэж нэрлэгддэг түншүүдийг ангилж болно. Түншийн профайл (үйлчлүүлэгч, ханган нийлүүлэгчид, өрсөлдөгчид) бүрийн хувьд та өөрийн өмч, нэмэлт мэдээлэл, мэдээллийг үүсгэж болно. Цаашилбал, эдгээр нэмэлт шинж чанарууд дээр үндэслэн ABC болон XYZ шинжилгээг хийж болно.

2. В.А.Крицман, Б.Я. - Дээд сургууль, 1983 он.

Байгалийн шинжлэх ухаанд хувьсгалт нээлтүүд ихэвчлэн авъяаслаг туршилтчдын хийсэн туршилтын үр дүнгийн нөлөөн дор хийгдсэн байдаг. Биологи, хими, физикийн томоохон туршилтууд нь бидний амьдарч буй ертөнц, материйн бүтэц, удамшлын дамжих механизмыг өөрчлөхөд хувь нэмэр оруулсан. Агуу туршилтуудын үр дүнд үндэслэн бусад онол, технологийн нээлтүүдийг хийсэн.

§ 9. Судалгааны онолын арга

Хичээл-лекц

Дэлхий дээр илүү чухал зүйлүүд байдаг

хамгийн сайхан нээлтүүд

аргуудын талаарх мэдлэг юм

тэд хийсэн

Лейбниц

https://pandia.ru/text/78/355/images/image014_2.gif" alt="(!LANG:Гарын үсэг: !" align="left" width="42 height=41" height="41">Метод. Классификация. Систематизация. Систематика. Индукция. Дедукция.!}

Физик үзэгдлийн ажиглалт, тайлбар. Физик хуулиуд. (Физик, 7 - 9 нүд).

Арга гэж юу вэ . аргаШинжлэх ухаанд тэд мэдлэгийг бий болгох арга, бодит байдлын практик болон онолын хөгжлийн хэлбэр гэж нэрлэдэг. Фрэнсис Бэкон энэ аргыг харанхуйд аялагчийн замыг гэрэлтүүлдэг дэнлүүтэй зүйрлэж: "Зам дээр явж буй доголон ч гэсэн замгүй явсан хүнээс түрүүлдэг" гэж хэлжээ. Зөв сонгогдсон арга нь ойлгомжтой, логиктой, тодорхой зорилгод хөтлөх, үр дүнд хүргэх ёстой. Аргын системийн тухай сургаал гэж нэрлэдэг арга зүй.

Шинжлэх ухааны үйл ажиллагаанд ашигладаг танин мэдэхүйн аргууд нь эмпирик (практик, туршилтын) аргууд: ажиглалт, туршилтболон онолын (логик, оновчтой) аргууд: шинжилгээ, синтез, харьцуулалт, ангилал, системчилэл, хийсвэрлэл, ерөнхий ойлголт, загварчлал, индукц, хасалт. Бодит шинжлэх ухааны мэдлэгт эдгээр аргуудыг үргэлж нэгдмэл байдлаар ашигладаг. Жишээлбэл, туршилтыг боловсруулахдаа асуудлын талаар урьдчилсан онолын ойлголттой байх, судалгааны таамаглал дэвшүүлэх, туршилт хийсний дараа үр дүнг математикийн аргаар боловсруулах шаардлагатай байдаг. Танин мэдэхүйн зарим онолын аргуудын онцлогийг авч үзье.

Ангилал ба системчилэл.Ангилал нь судалж буй объектын багцыг (анги) сонгосон шинж чанарын дагуу дэд бүлэг (дэд анги) болгон бүлэглэх замаар судалж буй материалыг цэгцлэх боломжийг олгодог.

Жишээлбэл, сургуулийн бүх сурагчдыг "охид", "хөвгүүд" гэсэн дэд ангиудад хувааж болно. Та мөн өндөр гэх мэт өөр функцийг сонгож болно. Энэ тохиолдолд ангиллыг янз бүрийн аргаар хийж болно. Жишээлбэл, 160 см-ийн өндрийн хязгаарыг сонгож, сурагчдыг "бага", "өндөр" дэд ангиудад ангилах эсвэл өсөлтийн хуваарийг 10 см-ийн сегмент болгон хуваах, дараа нь ангилал илүү нарийвчилсан болно. Хэрэв бид ийм ангиллын үр дүнг хэдэн жилийн турш харьцуулж үзвэл энэ нь оюутнуудын бие бялдрын хөгжлийн чиг хандлагыг эмпирик байдлаар тогтоох боломжийг олгоно. Үүний үр дүнд ангиллыг арга болгон ашиглаж, шинэ мэдлэг олж авах, тэр ч байтугай шинэ шинжлэх ухааны онол бий болгох үндэс суурь болж болно.

Шинжлэх ухаанд ижил объектуудын ангилалыг зорилгоос хамааран өөр өөр шалгуураар ихэвчлэн ашигладаг. Гэсэн хэдий ч тэмдэг (ангилах үндэс) нь үргэлж дангаараа сонгогддог. Жишээлбэл, химичүүд "хүчил" гэсэн ангиллыг задралын зэрэг (хүчтэй ба сул), хүчилтөрөгчийн агууламж (хүчилтөрөгч агуулсан ба исэлддэггүй), физик шинж чанараар нь (дэгдэмхий - дэгдэмхий; уусдаг) дэд ангилалд хуваадаг. - уусдаггүй) болон бусад шинж чанарууд.

Шинжлэх ухааны хөгжлийн явцад ангилал өөрчлөгдөж болно.

XX зууны дунд үед. төрөл бүрийн судалгаа цөмийн урвалууданхан шатны (хугардаггүй) бөөмсийг нээхэд хүргэсэн. Эхэндээ тэдгээрийг массаар нь ангилж эхэлсэн тул лептон (жижиг), мезон (завсрын), барион (том), гиперон (хэт том) гарч ирэв. Цаашдын хөгжилфизикийн судалгаагаар массаар нь ангилах нь физикийн утга багатай боловч нэр томьёо нь хадгалагдан үлдэж, улмаар барионуудаас хамаагүй илүү масстай лептонууд гарч ирэв.

Ангилалыг хүснэгт эсвэл диаграм (график) хэлбэрээр хялбархан тусгасан болно. Жишээлбэл, нарны аймгийн гаригуудын ангилалыг диаграмм - графикаар дүрсэлсэн нь дараах байдалтай байж болно.

ТОМ ГАРГАГЧИД

НАРНЫ СИСТЕМ

ХӨРӨНГИЙН ГАРАГ

ГАРАГ - АВАРГА

ПЛУТО

MERCU-

ВЕНА-

АНГАРАГ

Бархасбадь

САНчир

Тэнгэрийн ван

Энэхүү ангилалд багтсан Плутон гараг нь тусдаа дэд ангиллыг төлөөлдөг бөгөөд ямар ч гаригт хамаарахгүй гэдгийг анхаарна уу хуурай газрын бүлэг, аварга гаригуудад ч биш. Эрдэмтэд Плутон нь астероидтой төстэй шинж чанартай бөгөөд нарны аймгийн захад олон байдаг гэдгийг тэмдэглэжээ.

Байгалийн нарийн төвөгтэй системийг судлахдаа ангилал нь байгалийн шинжлэх ухааны онолыг бий болгох эхний алхам болдог. дараагийн илүү өндөр түвшинсистемчилэл (систематик) юм. Системчилэл нь хангалттай их хэмжээний материалын ангиллын үндсэн дээр хийгддэг. Үүний зэрэгцээ хуримтлагдсан материалыг объектуудын хоорондын бүх харилцааг тусгасан систем болгон харуулах боломжийг олгодог хамгийн чухал шинж чанаруудыг онцлон тэмдэглэв. Энэ нь олон янзын объектууд, объектууд нь өөрөө нарийн төвөгтэй системүүд байдаг тохиолдолд зайлшгүй шаардлагатай. Шинжлэх ухааны мэдээллийг системчлэлийн үр дүн юм ангилал зүйэсвэл өөрөөр - ангилал зүй. Систематик нь шинжлэх ухааны салбар болох биологи, геологи, хэл шинжлэл, угсаатны зүй зэрэг мэдлэгийн салбарт хөгжсөн.

Ангилал судлалын нэгжийг таксон гэж нэрлэдэг. Биологийн шинжлэх ухаанд таксон нь төрөл, анги, овог, төрөл, дараалал гэх мэтийг нэгтгэдэг. нэг системшаталсан зарчмын дагуу өөр өөр зэрэглэлийн такс. Ийм систем нь одоо байгаа болон урьд нь устаж үгүй ​​болсон бүх организмын тодорхойлолтыг багтаасан бөгөөд тэдгээрийн хувьслын арга замыг олж мэддэг. Эрдэмтэд олчихвол шинэ төрөл, дараа нь тэд ерөнхий систем дэх байр сууриа баталгаажуулах ёстой. Өөрчлөлтийг системд өөрөө хийх боломжтой бөгөөд энэ нь хөгжиж, динамик хэвээр байна. Системчилсэн арга барил нь бүх төрлийн организмыг чиглүүлэхэд хялбар болгодог - зөвхөн 1.5 сая орчим төрлийн амьтан, 500 мянга гаруй төрлийн ургамал, бусад бүлгийн организмуудыг тооцохгүй. Орчин үеийн биологийн систем нь Сент-Хилерийн хуулийг тусгасан байдаг: "Амьдралын олон янз байдал нь янз бүрийн зэрэглэлийн таксонуудын шаталсан бүлгүүдээс бүрдсэн байгалийн ангилал зүйн системийг бүрдүүлдэг."

Индукц ба хасалт.Хуримтлагдсан мэдээллийг системчлэх үндсэн дээр тодорхой зүйлээс ерөнхийд нь одоо байгаа хэв маягийн талаар дүгнэлт хийдэг мэдлэгийн замыг индукц гэж нэрлэдэг. Байгаль судлах арга болох энэ аргыг Английн гүн ухаантан Ф.Бэкон боловсруулсан. Тэрээр: "Аль болох олон тохиолдлыг авч үзэх шаардлагатай - судалж буй үзэгдэл байгаа болон байхгүй, гэхдээ түүнтэй уулзахаар төлөвлөж буй тохиолдлуудыг хоёуланг нь авах шаардлагатай; дараа нь тэдгээрийг аргачлалаар цэгцэлж, хамгийн их магадлалтай тайлбарыг өгөх ёстой; эцэст нь энэ тайлбарыг баримттай харьцуулан шалгахыг хичээгээрэй.

Бодол санаа, дүр төрх

Ф.Бэкон, С.Холмс нарын хөрөг зураг

Эрдэмтэн, утга зохиолын баатрын хөрөг яагаад зэрэгцэн оршдог вэ?

Индукц бол дэлхийн тухай шинжлэх ухааны мэдлэгийг олж авах цорын ганц арга зам биш юм. Хэрэв туршилтын физик, хими, биологи нь индукцийн үндсэн дээр шинжлэх ухаан болгон бүтээгдсэн бол онолын физик, орчин үеийн математик систем дээр суурилдаг. аксиомууд- шинжлэх ухааны мэдэгдлийн нийтлэг ойлголт, түүхэн хөгжлийн түвшингээс харахад тууштай, таамаглалтай, найдвартай. Дараа нь эдгээр аксиомууд дээр ерөнхийөөс тусгай руу дүгнэлт гаргаж, үндэслэлээс үр дагавар руу шилжих замаар мэдлэгийг бий болгож чадна. Энэ аргыг хасалт гэж нэрлэдэг. Үүнийг боловсруулсан

Рене Декарт, Францын гүн ухаантан, эрдэмтэн.

Нэг сэдвийн талаар янз бүрийн аргаар мэдлэг олж авах гайхалтай жишээ бол селестиел биетүүдийн хөдөлгөөний хуулиудыг нээх явдал юм. 17-р зууны эхэн үеийн Ангараг гарагийн хөдөлгөөний талаарх ажиглалтын их хэмжээний мэдээлэлд үндэслэн И.Кеплер. нарны аймгийн гаригуудын хөдөлгөөний эмпирик хуулиудыг индукцаар нээсэн. Мөн зууны төгсгөлд Ньютон бүх нийтийн таталцлын хуулийн үндсэн дээр селестиел биетүүдийн хөдөлгөөний ерөнхий хуулиудыг дедуктив байдлаар гаргажээ.

Бодит судалгааны үйл ажиллагаанд шинжлэх ухааны судалгааны аргууд харилцан уялдаатай байдаг.

1. ○ Байгалийн ухааны судалгааны арга зүй, арга зүй гэж юу болохыг тайлбарлана уу?

Эдгээр бүх ойролцоо тооцоолол нь үндэслэлтэй байх ёстой бөгөөд тэдгээрийн оруулсан алдааг тоогоор үнэлэх ёстой.

Байгалийн шинжлэх ухааны хууль бүр хэрэглэх хязгаартай байдгийг шинжлэх ухааны хөгжил харуулж байна. Жишээлбэл, Ньютоны хуулиудыг бичил ертөнцийн үйл явцыг судлахад ашиглах боломжгүй юм. Эдгээр үйл явцыг тайлбарлахын тулд квант онолын хуулиудыг томъёолсон бөгөөд тэдгээр нь макроскопийн биетүүдийн хөдөлгөөнийг тайлбарлахад хэрэглэвэл Ньютоны хуулиудтай дүйцэх болно. Загварчлалын үүднээс авч үзвэл энэ нь Ньютоны хуулиуд нь илүү ерөнхий онолын дагуу тодорхой ойролцоо утгатай загвар юм гэсэн үг юм. Гэсэн хэдий ч квант онолын хуулиуд нь үнэмлэхүй биш бөгөөд хэрэглэхэд хязгаарлалттай байдаг. Илүү ерөнхий хуулиудыг аль хэдийн томъёолж, илүү ерөнхий тэгшитгэлүүдийг олж авсан бөгөөд энэ нь эргээд хязгаарлалттай байдаг. Мөн энэ хэлхээнд төгсгөл харагдахгүй байна. Өнөөг хүртэл байгаль дээрх бүх зүйлийг дүрсэлсэн үнэмлэхүй хуулийг олж аваагүй бөгөөд үүнээс бүх тодорхой хуулиудыг гаргаж авах боломжтой. Тэгээд ч ийм хуулиудыг боловсруулж чадах эсэх нь тодорхойгүй байна. Гэхдээ энэ нь байгалийн шинжлэх ухааны хууль тогтоомжийн аль нэг нь үнэндээ загвар юм гэсэн үг юм. Энэ хэсэгт авч үзсэн эдгээр загваруудаас ялгаатай нь байгалийн шинжлэх ухааны хуулиуд нь тодорхой нэг үзэгдлийг бус, харин өргөн хүрээний үзэгдлийн ангилалд хамаарах загвар юм.

Кластер шинжилгээ нь

Сайхан өдөр. Энд би ажилдаа дуртай хүмүүсийг хүндэлдэг.

Миний найз Максим энэ ангилалд багтдаг. Тоо баримттай байнга ажиллаж, дүн шинжилгээ хийж, холбогдох тайланг гаргадаг.

Өчигдөр бид хамтдаа үдийн хоол идсэн тул бараг хагас цагийн турш тэр надад кластерийн шинжилгээ гэж юу вэ, ямар тохиолдолд хэрэглэх нь үндэслэлтэй бөгөөд тохиромжтой болохыг хэлэв. За, би яах вэ?

Би сайн санах ойтой тул би энэ бүх мэдээллийг анхны бөгөөд хамгийн мэдээлэлтэй хэлбэрээр нь аль хэдийн мэддэг байсан дашрамд өгөх болно.

Кластерын шинжилгээ нь объектуудыг нэг төрлийн бүлэгт (кластер эсвэл анги) хуваахад зориулагдсан. Энэ бол олон талт өгөгдлийн ангиллын ажил юм.

100 орчим өөр кластер хийх алгоритмууд байдаг ч хамгийн түгээмэл хэрэглэгддэг нь шаталсан кластерын шинжилгээ ба k-дундаж кластерчлал юм.

Кластер шинжилгээг хаана ашигладаг вэ? Маркетингийн хувьд энэ нь өрсөлдөгчид болон хэрэглэгчдийн сегментчилэл юм.

Удирдлагын хувьд: боловсон хүчнийг янз бүрийн түвшний сэдэл, бүлгүүдэд хуваах, ханган нийлүүлэгчдийн ангилал, гэрлэлтийн ижил төстэй үйлдвэрлэлийн нөхцөл байдлыг тодорхойлох.

Анагаах ухаанд шинж тэмдгийн ангилал, өвчтөн, эм. Социологийн хувьд судалгаанд оролцогчдыг нэг төрлийн бүлэгт хуваах. Чухамдаа кластерийн шинжилгээ нь хүний ​​амьдралын бүхий л салбарт сайнаар нотлогдсон.

Энэ аргын гоо үзэсгэлэн нь өгөгдөл багатай, санамсаргүй хэмжигдэхүүний тархалтын хэвийн байдлын шаардлага болон статистикийн шинжилгээний сонгодог аргын бусад шаардлагыг хангаагүй үед ч ажилладаг.

Хатуу нэр томьёо ашиглахгүйгээр кластер шинжилгээний мөн чанарыг тайлбарлая.
Та ажилчдын дунд санал асуулга явуулсан бөгөөд ажилтнуудаа хэрхэн хамгийн үр дүнтэй удирдахаа тодорхойлохыг хүсч байна гэж бодъё.

Өөрөөр хэлбэл, та ажилчдыг бүлгүүдэд хувааж, тус бүрдээ хамгийн үр дүнтэй хяналтын хөшүүргийг сонгохыг хүсч байна. Үүний зэрэгцээ, бүлгүүдийн хоорондын ялгаа нь тодорхой байх ёстой бөгөөд бүлгийн дотор санал асуулгад оролцогчид аль болох ижил төстэй байх ёстой.

Асуудлыг шийдэхийн тулд шаталсан кластерийн шинжилгээг ашиглахыг санал болгож байна.

Үүний үр дүнд бид модыг олж авах бөгөөд үүнийг хараад бид ажилчдыг хэдэн ангид (бүлэг) хуваахыг хүсч байгаагаа шийдэх ёстой.

Бид ажилтнуудыг гурван бүлэгт хуваахаар шийдсэн гэж бодъё, дараа нь кластер бүрт унасан хариулагчдыг судлахын тулд бид дараах агуулга бүхий таблетыг авна.


Дээрх хүснэгт хэрхэн үүссэнийг тайлбарлая. Эхний баганад өгөгдөл нь мөрөнд тусгагдсан кластерын дугаарыг агуулна.

Жишээлбэл, эхний кластер нь 80% эрэгтэй. Эхний кластерын 90% нь 30-аас 50 хүртэлх насны ангилалд багтдаг бөгөөд судалгаанд оролцогчдын 12% нь тэтгэмж маш чухал гэж үздэг. гэх мэт.

Кластер бүрийн судалгаанд оролцогчдын хөрөг зургийг гаргахыг хичээцгээе.

  1. Эхний бүлэг нь ихэвчлэн эрэгтэйчүүд байдаг. дундаж насудирдах албан тушаал хашиж байна. Нийгмийн багц (MED, LGOTI, TIME-free time) нь тэднийг сонирхдоггүй. Тэд ажил олгогчоос тусламж авахаас илүү сайн цалин авахыг илүүд үздэг.
  2. Хоёрдугаар бүлэг нь эсрэгээрээ нийгмийн багцыг илүүд үздэг. Энэ нь гол төлөв бага албан тушаал хашдаг "настан" хүмүүсээс бүрддэг. Тэдний хувьд цалин нь мэдээж чухал, гэхдээ бусад тэргүүлэх чиглэлүүд бий.
  3. Гурав дахь бүлэг нь "хамгийн залуу" юм. Өмнөх хоёроос ялгаатай нь сурах сонирхол, мэргэжлээрээ өсөх боломж илт байна. Энэ ангиллын ажилчид удахгүй эхний бүлгийг нөхөх сайхан боломж байна.

Тиймээс нэвтрүүлэх кампанит ажил төлөвлөж байна үр дүнтэй аргуудболовсон хүчний менежментийн хувьд манай нөхцөлд хоёрдугаар бүлгийн нийгмийн багцыг нэмэгдүүлэх, жишээлбэл, цалин хөлсөнд хохирол учруулах боломжтой болох нь ойлгомжтой.

Хэрэв бид ямар мэргэжилтнүүдийг сургалтанд явуулах талаар ярих юм бол гурав дахь бүлэгт анхаарлаа хандуулахыг зөвлөж байна.

Эх сурвалж: http://www.nickart.spb.ru/analysis/cluster.php

Кластер шинжилгээний онцлог

Кластер гэдэг нь гүйлгээ хийгдсэн тодорхой хугацаанд хөрөнгийн үнэ юм. Үүссэн худалдан авалт, борлуулалтын хэмжээг кластер доторх тоогоор заана.

Аливаа TF-ийн баар нь дүрмээр бол хэд хэдэн кластер агуулдаг. Энэ нь үнийн түвшин тус бүрээр тус бүр дээр байгаа худалдан авалт, борлуулалтын хэмжээ, тэдгээрийн үлдэгдлийг нарийвчлан харах боломжийг олгоно.


Нэг хөрөнгийн үнийн өөрчлөлт нь бусад хэрэгслийн үнийн өөрчлөлтийн гинжин хэлхээг зайлшгүй дагуулдаг.

Анхаар!

Ихэнх тохиолдолд чиг хандлагын хөдөлгөөний талаархи ойлголт нь хурдацтай хөгжиж байгаа үед аль хэдийн гарч ирдэг бөгөөд чиг хандлагын дагуу зах зээлд орох нь залруулах долгион руу унах эрсдэлтэй байдаг.

Амжилттай арилжаа хийхийн тулд одоогийн нөхцөл байдлыг ойлгож, ирээдүйн үнийн хөдөлгөөнийг урьдчилан таамаглах чадвартай байх шаардлагатай. Үүнийг кластер графикт дүн шинжилгээ хийх замаар мэдэж болно.

Кластер шинжилгээний тусламжтайгаар та хамгийн бага үнийн бараас ч зах зээлд оролцогчдын үйл ажиллагааг харж болно. Хөрөнгийн үнийн түвшин тус бүрээр гүйлгээний эзлэхүүний цэгийн хуваарилалтыг харуулдаг тул энэ нь хамгийн үнэн зөв бөгөөд нарийвчилсан дүн шинжилгээ юм.

Зах зээл дээр худалдагч, худалдан авагчдын ашиг сонирхлын хооронд байнгын зөрчилдөөн байдаг. Үнийн хамгийн жижиг хөдөлгөөн (шалз) бүр нь одоогийн байдлаар хоёр талдаа тохирсон буулт буюу үнийн түвшин рүү шилжих явдал юм.

Гэхдээ зах зээл динамик, худалдагч, худалдан авагчдын тоо байнга өөрчлөгдөж байдаг. Хэзээ нэгэн цагт зах зээлд худалдагч нар ноёрхож байсан бол дараагийн мөчид худалдан авагчид байх магадлалтай.

Хөрш үнийн түвшинд хийгдсэн гүйлгээний тоо мөн адил биш байна. Гэсэн хэдий ч, нэгдүгээрт, зах зээлийн нөхцөл байдал гүйлгээний нийт хэмжээ, зөвхөн дараа нь үнэд тусгагдсан байдаг.

Хэрэв та зах зээлд давамгайлж буй оролцогчдын (худалдагч эсвэл худалдан авагч) үйлдлийг харвал үнийн хөдөлгөөнийг өөрөө урьдчилан таамаглах боломжтой.

Кластер шинжилгээг амжилттай хэрэгжүүлэхийн тулд эхлээд кластер ба дельта гэж юу болохыг ойлгох хэрэгтэй.


Кластерийг үнийн хөдөлгөөн гэж нэрлэдэг бөгөөд энэ нь мэдэгдэж буй эзлэхүүнтэй гүйлгээ хийгдсэн түвшинд хуваагддаг. Дельта нь кластер бүрт тохиолддог худалдан авалт, борлуулалтын ялгааг харуулдаг.

Кластер буюу дельтануудын бүлэг бүр нь тухайн үед худалдан авагч эсвэл худалдагч зах зээлд давамгайлж байгаа эсэхийг тодорхойлох боломжийг олгодог.

Борлуулалт, худалдан авалтыг нэгтгэн нийт дельтийг тооцоолоход л хангалттай. Хэрэв дельта сөрөг байвал зах зээл хэт борлогддог, илүүдэл борлуулалтын гүйлгээ байдаг. Дельта эерэг байвал зах зээлд худалдан авагчид давамгайлах нь тодорхой.

Дельта өөрөө хэвийн эсвэл чухал утгыг авч болно. Кластер дахь хэвийн утгаас дээш байгаа дельта эзлэхүүний утгыг улаан өнгөөр ​​тодруулсан.

Хэрэв дельта нь дунд зэрэг байвал энэ нь зах зээл дээрх тэгш байдлыг илэрхийлдэг. Хэвийн дельта утгаараа зах зээл дээр трендийн хөдөлгөөн ажиглагддаг боловч чухал үнэ цэнэ нь үнийн өөрчлөлтийг үргэлж илэрхийлдэг.

CA-тай Forex арилжаа хийх

Хамгийн их ашиг олохын тулд дельта дунд зэргийн түвшингээс хэвийн түвшинд шилжих шилжилтийг тодорхойлох чадвартай байх хэрэгтэй. Үнэн хэрэгтээ, энэ тохиолдолд та хавтгайгаас чиг хандлага руу шилжих шилжилтийн эхлэлийг анзаарч, хамгийн их ашиг олох боломжтой болно.

Кластер диаграм нь илүү харагдахуйц бөгөөд үүн дээр та эзлэхүүний хуримтлал, хуваарилалтын мэдэгдэхүйц түвшинг харж, дэмжлэг, эсэргүүцлийн түвшинг харж болно. Энэ нь худалдаачинд арилжааны яг оруулгыг олох боломжийг олгодог.

Дельта ашиглан зах зээл дээрх борлуулалт, худалдан авалт давамгайлж байгааг дүгнэж болно. Кластер шинжилгээ нь гүйлгээг ажиглах, тэдгээрийн эзлэхүүнийг ямар ч TF-ийн баар дотор хянах боломжийг олгодог.

Энэ нь мэдэгдэхүйц дэмжлэг эсвэл эсэргүүцлийн түвшинд ойртох үед онцгой чухал юм. Зах зээлийг ойлгох түлхүүр нь кластерийн дүгнэлт юм.

Эх сурвалж: http://orderflowtrading.ru/analitika-rynka/obemy/klasternyy-analiz/

Кластер шинжилгээний хэрэглээний чиглэл, онцлог

Кластер анализ гэдэг нэр томьёо (анх 1939 онд Tryon нэвтрүүлсэн) нь уг багцыг агуулдаг янз бүрийн алгоритмуудангилал.

Ерөнхий асуулт, олон салбарын судлаачдын асуусан нь ажиглагдсан өгөгдлийг харааны бүтцэд хэрхэн зохион байгуулах вэ, i.e. ангилал зүйг өргөжүүлэх.

-ын дагуу орчин үеийн системБиологид хүлээн зөвшөөрөгдсөн хүн бол примат, хөхтөн амьтад, амниот, сээр нуруутан, амьтдад хамаардаг.

Энэ ангилалд нэгтгэх түвшин өндөр байх тусам харгалзах ангийн гишүүдийн хоорондын ижил төстэй байдал бага байгааг анхаарна уу.

Хүн хөхтөн амьтдын гэр бүлийн "алслагдсан" гишүүдтэй (жишээлбэл, нохой) гэх мэт бусад приматуудтай (өөрөөр хэлбэл сармагчин) илүү төстэй байдаг.

Өмнөх хэлэлцүүлэг нь кластерийн алгоритмуудын тухай ярьж байгаа боловч статистикийн ач холбогдлыг шалгах талаар юу ч дурдаагүй болохыг анхаарна уу.

Үнэн хэрэгтээ кластерийн шинжилгээ нь ердийн статистикийн арга биш, харин "объектуудыг кластер болгон хуваарилах" янз бүрийн алгоритмуудын "иж бүрдэл" юм.

Бусад олон статистикийн процедураас ялгаатай нь кластерийн шинжилгээний аргыг ихэнх тохиолдолд ангиудын талаар ямар нэгэн априори таамаглал байхгүй, гэхдээ судалгааны тодорхойлолтын шатанд байгаа тохиолдолд ашигладаг гэсэн үзэл бодол байдаг.

Анхаар!

Кластерийн шинжилгээ нь "хамгийн ач холбогдолтой шийдвэр"-ийг тодорхойлдог гэдгийг ойлгох хэрэгтэй.

Тиймээс, статистикийн ач холбогдлыг шалгах нь p-түвшин мэдэгдэж байгаа тохиолдолд ч (жишээлбэл, K-ийн аргад) үнэхээр хэрэглэгдэхгүй.

Кластерын техникийг олон төрлийн салбарт ашигладаг. Хартиган (1975) кластер шинжилгээний аргаар олж авсан үр дүнг агуулсан олон нийтлэгдсэн судалгааны тоймыг маш сайн харуулсан.

Жишээлбэл, анагаах ухааны салбарт өвчний бүлэглэл, өвчний эмчилгээ, өвчний шинж тэмдгүүд нь өргөн хэрэглэгддэг ангилал зүйд хүргэдэг.

Сэтгэцийн эмгэг судлалын салбарт паранойа, шизофрени гэх мэт шинж тэмдгийн бөөгнөрөлийг зөв оношлох нь эмчилгээг амжилттай явуулахад маш чухал юм. Археологийн хувьд кластерийн шинжилгээг ашиглан судлаачид чулуун багаж хэрэгсэл, оршуулгын объект гэх мэт ангилал тогтоохыг оролдож байна.

Кластер шинжилгээний өргөн хэрэглээг мэддэг Маркетингийн судалгаа. Ерөнхийдөө, мэдээллийн "уулсыг" цаашид боловсруулахад тохиромжтой бүлэгт ангилах шаардлагатай бол кластерийн шинжилгээ нь маш хэрэгтэй бөгөөд үр дүнтэй байдаг.

Модны бөөгнөрөл

Үндсэн зорилго хэсгийн жишээнд нэгдэх (модны бөөгнөрөл) алгоритмын зорилгыг тайлбарласан болно.

Энэ алгоритмын зорилго нь объектуудын хоорондын ижил төстэй байдал эсвэл зайг ашиглан объектуудыг (жишээлбэл, амьтдыг) хангалттай том кластер болгон нэгтгэх явдал юм. Ийм бөөгнөрөлийн ердийн үр дүн нь шаталсан мод юм.

Модны хэвтээ диаграммыг авч үзье. Диаграм нь ангийн объект бүрээс эхэлдэг (диаграммын зүүн талд).

Одоо та ямар объект өвөрмөц, юу нь бусдаас ялгарах шалгуураа аажмаар (маш жижиг алхмаар) "сулруулж" байна гэж төсөөлөөд үз дээ.

Өөрөөр хэлбэл, хоёр ба түүнээс дээш объектыг нэг кластерт нэгтгэх шийдвэртэй холбоотой босгыг бууруулна.

Үүний үр дүнд та улам олон объектыг хооронд нь холбож, улам бүр өөр өөр элементүүдийн илүү олон кластеруудыг нэгтгэдэг (нэгдүүлдэг).

Эцэст нь, сүүлчийн алхамд бүх объектуудыг нэгтгэдэг. Эдгээр диаграммд хэвтээ тэнхлэгүүд нь нэгтгэх зайг илэрхийлдэг (босоо дендрограммд босоо тэнхлэгүүд нь нэгтгэх зайг илэрхийлдэг).

Тиймээс, график дахь зангилаа бүрийн хувьд (үүнд шинэ кластер) харгалзах элементүүдийг шинэ нэг кластерт холбосон зайны хэмжээг харж болно.

Өгөгдөл нь хоорондоо ижил төстэй объектуудын кластерын хувьд тодорхой "бүтэцтэй" байвал энэ бүтэц нь шаталсан модонд янз бүрийн салбаруудаар тусгагдсан байх магадлалтай.

Холболтын аргаар амжилттай дүн шинжилгээ хийсний үр дүнд кластеруудыг (салбаруудыг) илрүүлж, тэдгээрийг тайлбарлах боломжтой болно.

Нэгдмэл эсвэл модны бөөгнөрөл хийх аргыг объект хоорондын ялгаа эсвэл зайтай кластер үүсгэхэд ашигладаг. Эдгээр зайг нэг хэмжээст эсвэл олон хэмжээст орон зайд тодорхойлж болно.

Жишээлбэл, хэрэв та кафед байгаа хоолны төрлийг ангилах шаардлагатай бол түүнд агуулагдах калорийн тоо, үнэ, амтыг субьектив үнэлгээ гэх мэтийг анхаарч үзэх боломжтой.

Олон хэмжээст орон зайд объект хоорондын зайг тооцоолох хамгийн шууд арга бол Евклидийн зайг тооцоолох явдал юм.

Хэрэв танд 2D эсвэл 3D зай байгаа бол энэ хэмжүүр нь орон зай дахь объектуудын хоорондох бодит геометрийн зай юм (объект хоорондын зайг соронзон хальсны хэмжүүрээр хэмжсэн мэт).

Гэсэн хэдий ч, нэгтгэх алгоритм нь түүнд "болгосон" зай нь бодит эсвэл өөр ямар нэгэн гарган авсан зайны хэмжигдэхүүн эсэх талаар "санаа тавьдаггүй" бөгөөд энэ нь судлаачийн хувьд илүү ач холбогдолтой юм; мөн судлаачдын хувьд тулгамдсан асуудал бол тодорхой хэрэглээнд тохирох аргыг сонгох явдал юм.

Евклидийн зай.Энэ бол хамгийн түгээмэл зай юм шиг санагддаг. Энэ нь ердөө л олон хэмжээст орон зай дахь геометрийн зай бөгөөд дараах байдлаар тооцоологддог.

Евклидийн зайг (болон түүний квадрат) стандартчилсан өгөгдлөөр бус харин анхны өгөгдлөөр тооцдог болохыг анхаарна уу.

Энэ нь тодорхой давуу талтай (жишээлбэл, шинэ объектыг шинжилгээнд оруулахад хоёр объектын хоорондох зай өөрчлөгддөггүй, энэ нь хэт давсан үзүүлэлт болж хувирдаг) үүнийг тооцоолох ердийн арга юм.

Анхаар!

Гэсэн хэдий ч, зайг тооцоолох тэнхлэгүүдийн хоорондын ялгаа нь зайд ихээхэн нөлөөлдөг. Жишээлбэл, хэрэв тэнхлэгүүдийн аль нэгийг сантиметрээр хэмжиж, дараа нь миллиметрт хөрвүүлбэл (утгуудыг 10-аар үржүүлбэл) координатаас тооцоолсон эцсийн Евклидийн зай (эсвэл Евклидийн зайны квадрат) болно. эрс өөрчлөгдөж, үүний үр дүнд кластерийн шинжилгээний үр дүн өмнөхөөсөө эрс ялгаатай байж болно.

Евклидийн зайны квадрат.Заримдаа та илүү алслагдсан объектуудад илүү их жин өгөхийн тулд стандарт Евклидийн зайг квадрат болгохыг хүсч болно.

Энэ зайг дараах байдлаар тооцоолно.

Хотын блок зай (Манхэттэн зай).Энэ зай нь зүгээр л координат дээрх ялгааны дундаж юм.

Ихэнх тохиолдолд энэ зайны хэмжүүр нь ердийн Евклидийн зайтай ижил үр дүнд хүргэдэг.

Гэсэн хэдий ч, энэ хэмжүүрийн хувьд бие даасан том ялгааны нөлөөлөл буурдаг гэдгийг анхаарна уу (тэдгээр нь квадрат биш учраас). Манхэттэний зайг дараах томъёогоор тооцоолно.

Чебышев зай.Энэ зай нь хоёр объектыг аль нэг координатаараа (ямар нэг хэмжээст) ялгаатай бол "өөр" гэж тодорхойлоход хэрэг болно. Чебышевын зайг дараахь томъёогоор тооцоолно.

Эрчим хүчний зай.Заримдаа харгалзах объектууд нь маш өөр байдаг хэмжээстэй холбоотой жинг аажмаар нэмэгдүүлэх эсвэл багасгахыг хүсдэг.

Үүнийг эрчим хүчний хуулийн зайг ашиглан хийж болно. Эрчим хүчний зайг дараах томъёогоор тооцоолно.

Энд r ба p нь хэрэглэгчийн тодорхойлсон параметрүүд юм. Тооцооллын цөөн хэдэн жишээ нь энэ хэмжүүр хэрхэн "ажиллаж байгааг" харуулж чадна.

p параметр нь бие даасан координатын зөрүүг аажмаар жинлэх, r параметр нь объектын хоорондох том зайг аажмаар жинлэх үүрэгтэй. Хэрэв хоёр параметр - r ба p хоёр тэнцүү бол энэ зай нь Евклидийн зайтай давхцдаг.

Санал нийлэхгүй байгаа хувь.Энэ хэмжигдэхүүнийг өгөгдөл нь ангилсан тохиолдолд ашигладаг. Энэ зайг дараах томъёогоор тооцоолно.

Холбоо эсвэл холбооны дүрэм

Эхний алхамд объект бүр тусдаа кластер байх үед эдгээр объектуудын хоорондох зайг сонгосон хэмжүүрээр тодорхойлно.

Гэсэн хэдий ч хэд хэдэн объектыг хооронд нь холбоход кластер хоорондын зайг хэрхэн тодорхойлох вэ гэсэн асуулт гарч ирнэ.

Өөрөөр хэлбэл, танд хоёр кластерт нэгдэх эсвэл холбох дүрэм хэрэгтэй. Энд янз бүрийн боломжууд бий: жишээлбэл, хоёр кластерын аль ч хоёр объект бие биендээ харгалзах холбоосын зайнаас илүү ойр байх үед та хоёр кластерыг хооронд нь холбож болно.

Өөрөөр хэлбэл, та кластер хоорондын зайг тодорхойлохын тулд "хамгийн ойрын хөршийн дүрэм" -ийг ашигладаг; энэ аргыг ганц холбоосын арга гэж нэрлэдэг.

Энэ дүрэм нь "fibrous" кластеруудыг бий болгодог, i.e. кластерууд нь зөвхөн бие биенээсээ илүү ойр байдаг бие даасан элементүүдээр "холбогдсон".

Эсвэл та хөршүүдийг бусад бүх онцлог хосуудаас хамгийн хол байгаа кластерт ашиглаж болно. Энэ аргыг бүрэн холбоосын арга гэж нэрлэдэг.

Дээр дурдсантай адил кластерт нэгдэх өөр олон аргууд байдаг.

Нэг холболт (хамгийн ойрын хөршийн арга). Дээр дурдсанчлан, энэ аргаар хоёр кластерын хоорондох зайг өөр өөр кластер дахь хамгийн ойрын хоёр объектын (хамгийн ойрын хөршүүд) хоорондын зайгаар тодорхойлно.

Энэ дүрэм нь тодорхой утгаараа объектуудыг хооронд нь холбож кластер үүсгэх ёстой бөгөөд үүссэн кластерууд нь урт "мөр"-ээр илэрхийлэгдэх хандлагатай байдаг.

Бүрэн холболт (хамгийн алслагдсан хөршүүдийн арга).Энэ аргын хувьд кластеруудын хоорондох зайг өөр өөр кластер дахь аль ч хоёр объектын хоорондох хамгийн том зай гэж тодорхойлдог (өөрөөр хэлбэл "хамгийн алслагдсан хөршүүд").

Жинлээгүй хос дундаж.Энэ аргын хувьд хоёр өөр кластерын хоорондох зайг тэдгээрийн доторх бүх хос объектын хоорондох дундаж зайгаар тооцдог.

Энэ арга нь объектууд өөр өөр "төглөл" үүсгэх үед үр дүнтэй байдаг ч өргөтгөсөн ("гинж" төрлийн) кластеруудын хувьд адилхан сайн ажилладаг.

Sneath болон Sokal (1973) номондоо энэ аргыг арифметик дундажийг ашиглан жингүй хос бүлгийн арга гэж нэрлэхийн тулд UPGMA товчлолыг оруулсан болохыг анхаарна уу.

Хосоор жигнэсэн дундаж.Энэ арга нь жинлээгүй хосын дундаж аргатай адил бөгөөд зөвхөн тухайн кластеруудын хэмжээг (өөрөөр хэлбэл тэдгээрт агуулагдах объектын тоо) тооцоололд жинлэх хүчин зүйл болгон ашигладаг.

Тиймээс санал болгож буй аргыг (өмнөхөөс илүү) кластерын хэмжээ тэгш бус гэж үзвэл ашиглах ёстой.

Снеат, Сокал (1973) нар энэ аргыг арифметик дундажийг ашиглан жигнэсэн хос бүлгийн арга гэж нэрлэхийн тулд WPGMA товчлолыг нэвтрүүлсэн.

Жингүй центроид арга. Энэ аргын хувьд хоёр кластерын хоорондох зайг тэдгээрийн хүндийн төвүүдийн хоорондох зай гэж тодорхойлдог.

Анхаар!

Снеат, Сокал (1973) нар UPGMC товчлолыг ашиглан энэ аргыг центроид дундажийг ашиглан жингүй хос бүлгийн арга гэж нэрлэдэг.

Жинлэсэн центроид арга (медиан). Энэ арга нь өмнөх аргатай адил бөгөөд кластерын хэмжээ хоорондын зөрүүг (өөрөөр хэлбэл тэдгээрийн доторх объектын тоог) харгалзан үзэхийн тулд жинг тооцоолоход ашигладаг.

Тиймээс, хэрэв кластерын хэмжээгээр мэдэгдэхүйц ялгаа байгаа бол (эсвэл сэжиглэж байгаа) энэ аргыг өмнөх аргаас илүүд үздэг.

Снеат, Сокал (1973) нар WPGMC товчлолыг центроид дундажийг ашиглан жигнэсэн хос бүлгийн арга гэж нэрлэсэн.

Тойргийн арга.Энэ арга нь кластер хоорондын зайг тооцоолохдоо ANOVA аргыг ашигладаг тул бусад бүх аргуудаас ялгаатай.

Энэ арга нь алхам бүрт үүсч болох хоёр (таамаг) кластерын квадратуудын нийлбэрийг (SS) багасгадаг.

Дэлгэрэнгүйг Тойрогоос (1963) олж болно. Ерөнхийдөө энэ арга нь маш үр дүнтэй мэт боловч жижиг кластер үүсгэх хандлагатай байдаг.

Өмнө нь энэ аргыг бөөгнөрөх ёстой "объектууд" -ын хувьд авч үзсэн. Бусад бүх төрлийн шинжилгээнд судлаачийн сонирхсон асуултыг ихэвчлэн ажиглалт эсвэл хувьсагчаар илэрхийлдэг.

Ажиглалт болон хувьсагчийн аль алинаар нь кластер хийх нь нэлээд сонирхолтой үр дүнд хүргэж болох нь харагдаж байна.

Жишээлбэл, эмнэлгийн судлаач зүрхний өвчтэй өвчтөнүүдийн нөхцөл байдлын (ажиглалтын) янз бүрийн шинж чанаруудын (хувьсагчийн) талаар мэдээлэл цуглуулж байна гэж төсөөлөөд үз дээ.

Судлаач ижил төстэй шинж тэмдэг бүхий өвчтөнүүдийн кластерийг тодорхойлохын тулд ажиглалтыг (өвчтөнүүдийн) цуглуулахыг хүсч болно.

Үүний зэрэгцээ судлаач ижил төстэй физик төлөвтэй холбоотой хувьсагчдын кластерийг тодорхойлохын тулд хувьсагчдын кластер хийхийг хүсч болно.e

Ажиглалт эсвэл хувьсагчдыг кластерлах эсэх талаар ярилцсаны дараа яагаад хоёр чиглэлд кластер хийж болохгүй гэж?

Cluster Analysis модуль нь үүнийг хийх үр дүнтэй хоёр талын нэгдэх процедурыг агуулдаг.

Гэсэн хэдий ч ажиглалт болон хувьсагч хоёулаа утга учиртай кластеруудыг илрүүлэхэд нэгэн зэрэг хувь нэмэр оруулах төлөвтэй байгаа нөхцөлд хоёр талын нэгдмэл байдлыг (харьцангуй ховор) ашигладаг.

Тиймээс, өмнөх жишээ рүү буцахдаа бид эмнэлгийн судлаач биеийн байдлын шинж чанарын тодорхой кластертай ижил төстэй өвчтөнүүдийн кластерийг тодорхойлох шаардлагатай гэж үзэж болно.

Хүлээн авсан үр дүнг тайлбарлахад хүндрэлтэй байгаа нь янз бүрийн кластеруудын ижил төстэй байдал нь хувьсагчдын дэд бүлгийн зарим ялгаанаас үүдэлтэй (эсвэл шалтгаан) байж болох юм.

Тиймээс үүссэн кластерууд нь угаасаа нэг төрлийн бус байдаг. Магадгүй энэ нь эхэндээ жаахан бүрхэг мэт санагдаж магадгүй юм; үнэндээ, тайлбарласан кластер шинжилгээний бусад аргуудтай харьцуулахад хоёр талын нэгдэл нь хамгийн бага ашиглагддаг арга юм.

Гэсэн хэдий ч зарим судлаачид энэ нь хайгуулын өгөгдөлд дүн шинжилгээ хийх хүчирхэг хэрэгсэл санал болгодог гэж үздэг (дэлгэрэнгүй мэдээллийг Хартиганы энэ аргын тайлбарыг үзнэ үү (Хартиган, 1975).).

K гэдэг нь арга гэсэн үг

Энэ кластерийн арга нь нэгдэл (модны бөөгнөрөл) болон хоёр талын нэгдэл гэх мэт бөөгнөрөх аргуудаас эрс ялгаатай. Та аль хэдийн кластерын тооны талаар таамаглал дэвшүүлсэн гэж бодъё (ажиглалтаар эсвэл хувьсагчаар).

Та системд яг гурван кластер үүсгэхийг хэлж болно, ингэснээр тэдгээр нь аль болох ялгаатай байна.

K-Means алгоритм нь яг ийм төрлийн асуудлыг шийддэг. Ерөнхийдөө K-means арга нь аль болох хол зайтай яг K ялгаатай кластеруудыг байгуулдаг.

Биеийн байдлын жишээн дээр анагаах ухааны судлаач өөрийн эмнэлзүйн туршлагаасаа өвчтөнүүд нь ерөнхийдөө гурван өөр ангилалд багтдаг гэсэн "тооцоотой" байж болно.

Анхаар!

Хэрэв тийм бол кластер бүрийн физик үзүүлэлтүүдийн янз бүрийн хэмжүүрийн арга хэрэгсэл нь судлаачийн таамаглалыг илэрхийлэх тоон аргыг (жишээлбэл, 1-р кластерт байгаа өвчтөнүүдэд 1-ийн өндөр параметр, 2-оос бага параметртэй гэх мэт) өгөх болно.

Тооцооллын үүднээс та энэ аргыг "урвуу" дисперсийн шинжилгээ гэж үзэж болно. Хөтөлбөр нь санамсаргүй байдлаар сонгогдсон K кластеруудаас эхэлж, дараа нь объектын харьяаллыг өөрчилнө:

  1. кластер доторх хэлбэлзлийг багасгах,
  2. кластер хоорондын хэлбэлзлийг дээд зэргээр нэмэгдүүлэх.

Энэ арга нь урвуу дисперсийн шинжилгээ (ANOVA)-тай төстэй бөгөөд ANOVA дахь ач холбогдлын тест нь бүлгийн дундаж нь бие биенээсээ ялгаатай гэсэн таамаглалыг шалгахдаа бүлэг хоорондын болон бүлгийн доторх хэлбэлзлийг харьцуулдаг.

K-түлхүүр бүлэглэлд програм нь дисперсийн шинжилгээ (ANOVA) хийхдээ хамгийн чухал үр дүнд хүрэхийн тулд объектуудыг (жишээ нь, ажиглалт) нэг бүлгээс (кластер) нөгөөд шилжүүлдэг.

Ер нь K-дундлагын кластерийн шинжилгээний үр дүнг гаргасны дараа кластерууд бие биенээсээ хэрхэн ялгаатай байгааг үнэлэхийн тулд хэмжээс бүрийн хувьд кластер бүрийн дундаж утгыг тооцоолж болно.

Шинжилгээнд ашигласан хэмжилтүүдийн ихэнх нь биш юмаа гэхэд маш өөр арга хэрэгслийг авах нь хамгийн тохиромжтой.

Эх сурвалж: http://www.biometrica.tomsk.ru/textbook/modules/stcluan.html

Объектуудыг шинж чанараар нь ангилах

Кластерийн шинжилгээ (кластерын шинжилгээ) - объектуудыг шинж чанараар нь ангилах, объектын нийлбэрийг шалгуур үзүүлэлтийг тодорхойлох, тодорхой бүлгийн объектуудыг сонгоход ойрхон нэг төрлийн бүлэгт хуваах олон хэмжээст статистик аргуудын багц.

Кластер гэдэг нь тухайн объектуудын ижил төстэй эсвэл ялгаатай хэмжигдэхүүн дээр үндэслэн кластерийн шинжилгээний үр дүнд тодорхойлсон объектуудын бүлэг юм.

Объект нь ангилах шаардлагатай судалгааны тодорхой сэдвүүд юм. Ангилал дахь объектууд нь дүрмээр бол ажиглалт юм. Жишээлбэл, бүтээгдэхүүний хэрэглэгчид, улс орон эсвэл бүс нутаг, бүтээгдэхүүн гэх мэт.

Хэдийгээр хувьсагчаар кластер шинжилгээ хийх боломжтой. Олон хэмжээст кластерийн шинжилгээнд объектуудыг ангилах нь хэд хэдэн шалгуурын дагуу нэгэн зэрэг явагддаг.

Эдгээр нь кластерийн шинжилгээний аргаас хамааран тоон болон категорийн хувьсагч байж болно. Тэгэхээр, гол зорилгокластерийн шинжилгээ - түүвэр дэх ижил төстэй объектуудын бүлгийг олох.

Кластерийн шинжилгээний олон хэмжээст статистик аргуудын багцыг шаталсан аргууд (бөглөгч ба хуваах) болон шаталсан бус (k-дундаж арга, хоёр үе шаттай кластерийн шинжилгээ) гэж хувааж болно.

Гэсэн хэдий ч, нийтээр хүлээн зөвшөөрөгдсөн аргуудын ангилал байдаггүй бөгөөд заримдаа кластер шинжилгээний аргууд нь шийдвэрийн мод, мэдрэлийн сүлжээ, ялгаварлан гадуурхах шинжилгээ, логистик регрессийг бий болгох аргуудыг агуулдаг.

Кластер шинжилгээний хамрах хүрээ нь олон талт байдлаас шалтгаалан маш өргөн юм. Кластер шинжилгээг эдийн засаг, маркетинг, археологи, анагаах ухаан, сэтгэл судлал, хими, биологи, Төрийн захиргаа, филологи, антропологи, социологи болон бусад салбарууд.

Кластер шинжилгээг ашиглах зарим жишээ энд байна:

  • анагаах ухаан - өвчний ангилал, тэдгээрийн шинж тэмдэг, эмчилгээний аргууд, өвчтөний бүлгүүдийн ангилал;
  • маркетинг - компанийн бүтээгдэхүүний шугамыг оновчтой болгох, зах зээлийг бараа бүтээгдэхүүн эсвэл хэрэглэгчдийн бүлэгт хуваах, боломжит хэрэглэгчийг тодорхойлох зорилтууд;
  • социологи - судалгаанд оролцогчдыг нэг төрлийн бүлэгт хуваах;
  • сэтгэцийн эмгэг - шинж тэмдгийн бүлгийг зөв оношлох нь амжилттай эмчилгээ хийхэд чухал үүрэг гүйцэтгэдэг;
  • биологи - организмыг бүлгээр нь ангилах;
  • эдийн засаг - ОХУ-ын субьектүүдийг хөрөнгө оруулалтын сонирхлын дагуу ангилах.

Эх сурвалж: http://www.statmethods.ru/konsalting/statistics-methody/121-klasternyj-analyz.html

Кластер шинжилгээний талаархи ерөнхий мэдээлэл

Кластер шинжилгээ нь янз бүрийн ангиллын алгоритмуудыг агуулдаг. Олон салбарын судлаачдын асуудаг нийтлэг асуулт бол ажиглагдсан өгөгдлийг харааны бүтцэд хэрхэн зохион байгуулах вэ?

Жишээлбэл, биологичид амьтдыг задлах зорилготой янз бүрийн төрөлтэдгээрийн хоорондын ялгааг утга учиртай тайлбарлах.

Кластер шинжилгээний даалгавар бол объектуудын анхны багцыг ижил төстэй, ойрхон объектуудын бүлэгт хуваах явдал юм. Эдгээр бүлгүүдийг кластер гэж нэрлэдэг.

Өөрөөр хэлбэл, кластерийн шинжилгээ нь объектыг шинж чанараар нь ангилах нэг арга юм. Ангиллын үр дүн нь утга учиртай тайлбартай байх нь зүйтэй юм.

Кластер шинжилгээний аргаар олж авсан үр дүнг янз бүрийн салбарт ашигладаг. Маркетингийн хувьд энэ нь өрсөлдөгчид болон хэрэглэгчдийн сегментчилэл юм.

Сэтгэцийн эмгэгийн хувьд паранойа, шизофрени гэх мэт шинж тэмдгүүдийг зөв оношлох нь амжилттай эмчилгээ хийхэд маш чухал юм.

Удирдлагын хувьд ханган нийлүүлэгчдийн ангилал, гэрлэлтийн ижил төстэй үйлдвэрлэлийн нөхцөл байдлыг тодорхойлох нь чухал юм. Социологийн хувьд судалгаанд оролцогчдыг нэг төрлийн бүлэгт хуваах. Багцын хөрөнгө оруулалт хийхдээ бүлэглэх нь чухал үнэт цаасАшигт ажиллагааны чиг хандлагын ижил төстэй байдлын дагуу хөрөнгийн зах зээлийн талаарх олж авсан мэдээлэлд үндэслэн тухайн эрсдэлийн хэмжээгээр хөрөнгө оруулалтаас ашгийг нэмэгдүүлэх боломжийг олгодог оновчтой хөрөнгө оруулалтын багцыг бий болгох.

Ерөнхийдөө ийм төрлийн их хэмжээний мэдээллийг ангилж, цаашид боловсруулахад тохиромжтой хэлбэрээр үзүүлэх шаардлагатай бол кластерийн шинжилгээ нь маш хэрэгтэй бөгөөд үр дүнтэй байдаг.

Кластер шинжилгээ нь нэлээд их хэмжээний мэдээллийг авч үзэх, нийгэм-эдийн засгийн мэдээллийн томоохон массивыг шахаж авсаархан, нүдээр харуулах боломжийг олгодог.

Анхаар!

Кластер шинжилгээ нь эдийн засгийн хөгжлийг тодорхойлсон цаг хугацааны цувралын багцад (жишээлбэл, эдийн засгийн ерөнхий нөхцөл байдал, түүхий эдийн нөхцөл) ихээхэн ач холбогдолтой юм.

Эндээс харгалзах үзүүлэлтүүдийн утгууд нэлээд ойрхон байсан үеүүдийг ялгаж, динамик нь хамгийн төстэй цаг хугацааны цувралын бүлгүүдийг тодорхойлох боломжтой.

Нийгэм, эдийн засгийн таамаглалын асуудлуудад кластерийн шинжилгээг бусад тоон аргуудтай (жишээлбэл, регрессийн шинжилгээтэй) хослуулах нь маш ирээдүйтэй юм.

Давуу болон сул талууд

Кластерийн шинжилгээ нь хэд хэдэн шинж чанараар тодорхойлогддог аливаа объектыг бодитой ангилах боломжийг олгодог. Үүнээс гарах хэд хэдэн давуу тал бий:

  1. Үүссэн кластеруудыг тайлбарлаж болно, өөрөөр хэлбэл ямар төрлийн бүлгүүд үнэхээр оршин тогтнож байгааг тайлбарлах боломжтой.
  2. Бие даасан кластеруудыг устгаж болно. Энэ нь өгөгдлийн багцад тодорхой алдаа гарсан тохиолдолд ашигтай бөгөөд үүний үр дүнд бие даасан объектуудын үзүүлэлтүүдийн утгууд огцом хазайдаг. Кластерийн шинжилгээг ашиглахдаа ийм объектууд тусдаа кластерт ордог.
  3. Цаашид дүн шинжилгээ хийхийн тулд зөвхөн сонирхсон шинж чанартай кластеруудыг сонгож болно.

Бусад аргуудын нэгэн адил кластер шинжилгээ нь тодорхой сул тал, хязгаарлалттай байдаг. Ялангуяа кластерын бүтэц, тоо нь сонгосон хуваалтын шалгуураас хамаарна.

Анхны өгөгдлийн массивыг илүү авсаархан хэлбэрт оруулахад тодорхой гажуудал үүсч, кластерийн параметрүүдийн ерөнхий утгын шинж чанараар солигдсоны улмаас бие даасан объектуудын бие даасан шинж чанарууд алдагдаж болно.

Арга зүй

Одоогийн байдлаар зуу гаруй өөр өөр кластерийн алгоритмууд мэдэгдэж байна. Тэдгээрийн олон талт байдал нь янз бүрийн тооцооллын аргуудаас гадна кластерын үндэс болсон өөр өөр ойлголтоор тайлбарлагддаг.

Statistica багц нь дараах кластерийн аргуудыг хэрэгжүүлдэг.

  • Шаталсан алгоритмууд - модны бөөгнөрөл. Шаталсан алгоритмууд нь дараалсан кластер хийх санаан дээр суурилдаг. Эхний шатанд объект бүрийг тусдаа кластер гэж үздэг. Дараагийн алхамд хамгийн ойр байрлах кластеруудын заримыг тусдаа кластер болгон нэгтгэнэ.
  • K - арга. Энэ аргыг хамгийн түгээмэл хэрэглэдэг. Энэ нь кластерийн шинжилгээний лавлагааны аргуудын бүлэгт багтдаг. Кластерын тоог хэрэглэгч өөрөө тогтоодог.
  • Хоёр талын холбоо. Энэ аргыг ашиглахдаа кластерийг хувьсагч (багана) болон ажиглалтын үр дүнгээр (мөр) нэгэн зэрэг гүйцэтгэдэг.

Хувьсагч болон ажиглалт дээр нэгэн зэрэг кластер хийх нь утга учиртай үр дүнг өгнө гэж найдаж байгаа тохиолдолд хоёр талын нэгдэх процедурыг гүйцэтгэдэг.

Процедурын үр дүн нь хувьсах хэмжигдэхүүн, тохиолдлын талаархи статистик үзүүлэлтүүд, мөн өгөгдлийн утгыг өнгөөр ​​​​кодолсон хоёр хэмжээст өнгөт диаграм юм.

Өнгөний хуваарилалтаар та нэг төрлийн бүлгүүдийн талаархи ойлголттой болно.

Хувьсагчдыг хэвийн болгох

Эхний багц объектыг кластер болгон хуваах нь объектуудын хоорондох зайг тооцоолох, объектын сонголттой холбоотой бөгөөд тэдгээрийн хоорондох зай нь бүх боломжит хамгийн бага юм.

Хамгийн түгээмэл хэрэглэгддэг нь бид бүгдэд мэддэг Евклидийн (геометрийн) зай юм. Энэ хэмжигдэхүүн нь орон зай дахь объектуудын ойролцоо байдлын талаархи зөн совингийн санаатай нийцдэг (объект хоорондын зайг соронзон хальсны хэмжүүрээр хэмжсэн мэт).

Гэхдээ өгөгдсөн хэмжүүрийн хувьд объект хоорондын зайд масштабын өөрчлөлт (хэмжих нэгж) хүчтэй нөлөөлж болно. Жишээлбэл, шинж чанаруудын аль нэгийг миллиметрээр хэмжиж, дараа нь түүний утгыг сантиметр болгон хөрвүүлбэл объект хоорондын Евклидийн зай эрс өөрчлөгдөнө. Энэ нь кластерийн шинжилгээний үр дүн өмнөхөөсөө эрс ялгаатай байх болно.

Хэрэв хувьсах хэмжигдэхүүнийг өөр өөр хэмжигдэхүүнээр хэмждэг бол тэдгээрийг урьдчилан хэвийн болгох, өөрөөр хэлбэл тэдгээрийг хэмжээсгүй хэмжигдэхүүн болгон хувиргах анхны өгөгдлийг өөрчлөх шаардлагатай.

Хэвийн байдал нь анхны орон зайн геометрийг ихээхэн гажуудуулж, кластерын үр дүнг өөрчлөх боломжтой

Statistica багцад аливаа x хувьсагчийг дараах томъёоны дагуу хэвийн болгодог.

Үүнийг хийхийн тулд хувьсагчийн нэр дээр хулганы баруун товчийг дараад нээгдэх цэснээс: Fill/ Standardize Block/ Standardize Columns командын дарааллыг сонгоно. Нормчилсон хувьсагчийн утгууд тэгтэй тэнцүү болж, хэлбэлзэл нь нэгтэй тэнцүү болно.

Статистик дахь K- гэсэн утгатай арга

K-means арга нь олон тооны объектыг бие биенээсээ хамгийн их зайд байрлах өөр өөр кластеруудын өгөгдсөн тооны K болгон хуваадаг.

Ер нь K-дундаж кластерын шинжилгээний үр дүнг гаргасны дараа кластерууд бие биенээсээ хэрхэн ялгаатай байгааг үнэлэхийн тулд хэмжээс бүрийн хувьд кластер бүрийн дундаж утгыг тооцоолж болно.

Шинжилгээнд ашигласан ихэнх хэмжилтийн хувьд та маш өөр арга хэрэгслийг авах нь хамгийн тохиромжтой.

Хэмжээ тус бүрээр олж авсан F-статистикийн утгууд нь харгалзах хэмжээс нь кластеруудыг хэр сайн ялгаж байгааг харуулах өөр нэг үзүүлэлт юм.

Жишээлбэл, нэг аж ахуйн нэгжийн 17 ажилтны ажил мэргэжлийн чанарын үзүүлэлтэд сэтгэл ханамжийн талаархи санал асуулгын үр дүнг авч үзье. Хүснэгтэнд асуулгын асуултын хариултыг арван онооны системээр оруулсан болно (1 нь хамгийн бага оноо, 10 нь дээд тал нь).

Хувьсагчийн нэрс нь дараах асуултын хариулттай тохирч байна.

  1. SLT - хувийн зорилго, байгууллагын зорилгын хослол;
  2. OSO - цалин хөлсний шударга байдлын мэдрэмж;
  3. TBD - байшингийн нутаг дэвсгэрийн ойролцоо байдал;
  4. PEW - эдийн засгийн сайн сайхан байдлын мэдрэмж;
  5. CR - ажил мэргэжлийн өсөлт;
  6. ZhSR - ажлын байрыг өөрчлөх хүсэл;
  7. OSB бол нийгмийн сайн сайхан байдлын мэдрэмж юм.

Энэ өгөгдлийг ашиглан ажилчдыг бүлгүүдэд хувааж, тус бүрдээ хамгийн үр дүнтэй хяналтын хөшүүргийг сонгох шаардлагатай.

Үүний зэрэгцээ, бүлгүүдийн хоорондын ялгаа нь тодорхой байх ёстой бөгөөд бүлгийн дотор санал асуулгад оролцогчид аль болох ижил төстэй байх ёстой.

Өнөөдрийг хүртэл ихэнх нь санал асуулгазөвхөн саналын хувийг өгдөг: эерэг хариултуудын гол тоо, эсвэл сэтгэл хангалуун бус байгаа хүмүүсийн хувийг харгалзан үздэг боловч энэ асуудлыг системтэйгээр авч үздэггүй.

Ихэнх тохиолдолд судалгаа нь нөхцөл байдлын чиг хандлагыг харуулдаггүй. Зарим тохиолдолд "тэмдэг" эсвэл "эсрэг" гэсэн хүмүүсийн тоог биш харин зайг эсвэл ижил төстэй байдлын хэмжүүрийг тоолох, өөрөөр хэлбэл ижил төстэй хүмүүсийн бүлгийг тодорхойлох шаардлагатай байдаг.

Кластер шинжилгээний процедурыг судалгааны мэдээлэлд үндэслэн зарим шинж чанаруудын бодит харилцааг тодорхойлж, тэдгээрийн хэв шинжийг бий болгоход ашиглаж болно.

Анхаар!

Кластерийн шинжилгээний процедуртай ажиллахдаа социологчийн априори таамаглал байх нь зайлшгүй нөхцөл биш юм.

Statistica программд кластерийн шинжилгээг дараах байдлаар гүйцэтгэдэг.

Кластерын тоог сонгохдоо дараахь зүйлийг баримтална уу: боломжтой бол кластерын тоо хэт их байж болохгүй.

Өгөгдсөн кластерын объектуудыг холбосон зай нь боломжтой бол энэ кластерт өөр зүйл нэгдэх зайнаас хамаагүй бага байх ёстой.

Кластерын тоог сонгохдоо ихэнхдээ нэгэн зэрэг хэд хэдэн зөв шийдэл байдаг.

Жишээлбэл, асуулгын асуултын хариулт нь энгийн ажилчид болон аж ахуйн нэгжийн удирдлагатай хэрхэн уялдаж байгааг бид сонирхож байна. Тиймээс бид K=2 гэж сонгоно. Цаашид сегментчилэхийн тулд та кластерын тоог нэмэгдүүлэх боломжтой.

  1. кластерын төвүүдийн хоорондох хамгийн их зайтай ажиглалтыг сонгох;
  2. зайг эрэмбэлэх, тогтмол давтамжтайгаар ажиглалтыг сонгох (анхдагч тохиргоо);
  3. Эхний ажиглалтын төвүүдийг авч, бусад объектуудыг тэдэнд хавсаргана.

Сонголт 1 нь бидний зорилгод тохиромжтой.

Олон кластерийн алгоритмууд нь ихэвчлэн өгөгдөлд үл хамаарах бүтцийг "ногдуулах" бөгөөд судлаачийн анхаарлыг сарниулдаг. Тиймээс кластерийн шинжилгээний хэд хэдэн алгоритмыг хэрэглэж, алгоритмын үр дүнгийн ерөнхий үнэлгээнд үндэслэн дүгнэлт гаргах нь туйлын чухал юм.

Шинжилгээний үр дүнг гарч ирэх харилцах цонхонд харж болно:

Хэрэв та "График" табыг сонговол кластерын төвүүдийн координатын графикийг зурах болно.


Энэ график дээрх тасархай шугам бүр нь аль нэг кластертай тохирч байна. Графикийн хэвтээ тэнхлэгийн хуваагдал бүр нь шинжилгээнд орсон хувьсагчдын аль нэгэнд тохирч байна.

Босоо тэнхлэг нь кластер бүрт багтсан объектуудын хувьсагчийн дундаж утгатай тохирч байна.

Бараг бүх асуудлаар хоёр бүлгийн хүмүүсийн үйлчилгээний карьерт хандах хандлага ихээхэн ялгаатай байгааг тэмдэглэж болно. Зөвхөн нэг асуудалд бүрэн санал нэгтэй байдаг - нийгмийн сайн сайхан байдлын утгаараа (OSB), эс тэгвээс энэ нь дутагдалтай (10 онооноос 2.5 оноо).

1-р кластер нь ажилчдыг, 2-р кластер нь менежментийг төлөөлдөг гэж үзэж болно. Менежерүүд хувийн зорилго, байгууллагын зорилго (SOL) хосолсон карьерын хөгжилд (CR) илүү сэтгэл хангалуун байдаг.

Тэд эдийн засгийн сайн сайхан байдлын мэдрэмж (SEW) болон цалингийн тэгш байдлын мэдрэмж (SWA) өндөр байдаг.

Тэд ажилчдаас илүү гэртэйгээ ойр байх талаар санаа зовдоггүй нь тээврийн асуудал багатай байдагтай холбоотой байх. Мөн менежерүүд ажлаа солих хүсэл багатай байдаг (JSR).

Хэдийгээр ажилчид хоёр ангилалд хуваагддаг ч ихэнх асуултанд харьцангуй ижил хариулт өгдөг. Өөрөөр хэлбэл, ямар нэг зүйл тохирохгүй байвал нийтлэг бүлэгажилчдын хувьд энэ нь дээд удирдлагад тохирохгүй, харин эсрэгээрээ.

Графикуудын уялдаа холбоо нь нэг бүлгийн сайн сайхан байдал нөгөө бүлгийн сайн сайхан байдалд тусгагдсан гэж дүгнэх боломжийг бидэнд олгодог.

1-р кластер нь байшингийн нутаг дэвсгэрийн ойролцоо байдалд сэтгэл хангалуун бус байна. Энэ бүлэг нь хотын янз бүрийн хэсгээс аж ахуйн нэгжид ихэвчлэн ирдэг ажилчдын гол хэсэг юм.

Тиймээс ашгийнхаа тодорхой хэсгийг тухайн аж ахуйн нэгжийн ажилчдын орон сууц барихад зориулахыг дээд удирдлагад санал болгох боломжтой.

Хоёр бүлгийн хүмүүсийн үйлчилгээний ажил мэргэжилд хандах хандлагад ихээхэн ялгаа ажиглагдаж байна. Ажил мэргэжлийн өсөлтөд сэтгэл хангалуун байгаа, хувийн зорилго, байгууллагын зорилгын давхцал өндөр байгаа ажилтнууд ажлаа солих хүсэлгүй, ажлынхаа үр дүнд сэтгэл ханамжтай байдаг.

Харин эсрэгээрээ ажлаа солих хүсэлтэй, ажлынхаа үр дүнд сэтгэл хангалуун бус байгаа ажилтнууд дээрх үзүүлэлтүүдэд сэтгэл хангалуун бус байдаг. Дээд удирдлагатөлөх ёстой Онцгой анхааралодоогийн нөхцөл байдалд.

Атрибут тус бүрийн дисперсийн шинжилгээний үр дүнг дисперсийн шинжилгээ товчийг дарснаар харуулна.

Кластерын төвөөс (SS доторх) объектуудын хазайлтын квадратуудын нийлбэр ба кластерын төвүүдийн хоорондох хазайлтын квадратуудын нийлбэр (SS хооронд), F-статистикийн утгууд болон p ач холбогдлын түвшинг харуулав.

Анхаар!

Бидний жишээн дээр хоёр хувьсагчийн ач холбогдлын түвшин нэлээд их байгаа нь цөөн тооны ажиглалттай холбоотой юм. Судалгааны бүрэн хувилбарыг цаасан дээрээс олж болно, кластер төвүүдийн хөрөнгийн тэгш байдлын талаархи таамаглалыг 0.01-ээс бага ач холбогдлын түвшинд үгүйсгэсэн болно.

Ангилал ба зайг хадгалах товчлуур нь кластер бүрт багтсан объектуудын тоо болон кластер бүрийн төв хүртэлх объектуудын зайг харуулдаг.

Хүснэгтэд CLUSTER дугаар бүхий кластеруудыг бүрдүүлж буй тохиолдлын дугаарууд (CASE_NO) болон кластер бүрийн төвөөс (DISTANCE) зайг харуулав.

Кластерт хамаарах объектуудын талаарх мэдээллийг файлд бичиж, цаашдын шинжилгээнд ашиглаж болно. Энэ жишээн дээр санал асуулгын үр дүнг харьцуулах нь 1-р кластер нь ихэвчлэн энгийн ажилчдаас, 2-р кластер нь менежерүүдээс бүрддэг болохыг харуулж байна.

Судалгааны үр дүнг боловсруулахдаа кластерийн шинжилгээ нь дундаж үзүүлэлтүүдийн гистограмм байгуулах эсвэл янз бүрийн үзүүлэлтүүдэд сэтгэл ханамжтай байгаа хүмүүсийн хувийг тооцоолох замаар дүгнэлт гаргах боломжийг олгодог хүчирхэг арга болж хувирсан нь харагдаж байна. ажлын амьдралын чанар.

Модны бөөгнөрөл нь шаталсан алгоритмын жишээ бөгөөд түүний зарчим нь эхлээд хамгийн ойр, дараа нь бие биенээсээ хол байгаа элементүүдийг дараалан кластер болгон нэгтгэх явдал юм.

Эдгээр алгоритмуудын ихэнх нь ижил төстэй (зай) матрицаас эхэлдэг бөгөөд тусдаа элемент бүрийг эхлээд тусдаа кластер гэж үздэг.

Кластерын шинжилгээний модулийг ачаалж, нэгдэхийг (модны кластер) сонгосны дараа кластерын параметр оруулах цонхонд дараах параметрүүдийг өөрчилж болно.

  • Анхны өгөгдөл (Оролт). Эдгээр нь судлагдсан өгөгдлийн матриц (Түүхий өгөгдөл) болон зайны матриц (Distance матриц) хэлбэртэй байж болно.
  • Объектийн төлөв байдлыг дүрсэлсэн бөөгнөрөл (Кластер) ажиглалт (Кейс (түүхий)) эсвэл хувьсагч (Хувьсагч (багана)).
  • Зайны хэмжүүр. Эндээс та дараах хэмжүүрүүдийг сонгож болно: Евклидийн зай, Дөрвөлжин евклидийн зай, Хот-блок (Манхэттен) зай, Чебычевын зайны хэмжүүр, Хүч ...), санал нийлэхгүй байгаа хувь (Зөрчилгүй хувь).
  • Кластерын арга (Нэгдлийн (холбох) дүрэм). Дараах сонголтуудыг энд хийх боломжтой: Нэг холбоос, Бүрэн холбоос, Жингүй хос бүлгийн дундаж, Жинлээгүй хос бүлгийн дундаж, Жинлээгүй хос бүлгийн төв, Жинлэгдсэн хос бүлгийн төв (медиан), Вардын арга.

Кластерын үр дүнд хэвтээ эсвэл босоо дендрограмм - объект ба кластеруудын хоорондох зайг дараалан нэгтгэх үед тодорхойлогддог графикийг бүтээдэг.

Графикийн модны бүтэц нь сонгосон босго буюу кластер хоорондын өгөгдсөн зайнаас хамаарч кластеруудыг тодорхойлох боломжийг олгодог.

Үүнээс гадна анхны объектуудын хоорондох зайны матриц (Distance matrix) харагдана; эх объект бүрийн дундаж ба стандарт хазайлт (Ялгах статистик).

Үзсэн жишээний хувьд бид анхдагч тохиргоотой хувьсагчдын кластер шинжилгээг хийх болно. Үүссэн дендрограммыг зурагт үзүүлэв.


Дендрограммын босоо тэнхлэг нь объектын хоорондох зай, объект, кластер хоорондын зайг зурдаг. Тиймээс SEB ба OSD хувьсагчдын хоорондох зай тавтай тэнцүү байна. Эхний шатанд эдгээр хувьсагчдыг нэг кластерт нэгтгэдэг.

Дендрограммын хэвтээ сегментүүдийг өгөгдсөн кластер хийх алхамд сонгосон босго зайд харгалзах түвшинд зурна.

Графикаас харахад "Ажлаа өөрчлөх хүсэл" (JSR) асуулт нь тусдаа кластер үүсгэдэг. Ер нь хаана ч хамаагүй хаях хүсэл хүн болгонд адилхан зочилдог. Цаашилбал, тусдаа кластер бол гэрт ойр орших нутаг дэвсгэрийн асуудал юм (LHB).

Ач холбогдлын хувьд 2-р байранд орсон нь К-ийн аргыг ашиглан хийсэн судалгааны үр дүнд орон сууц барих шаардлагатай гэсэн дүгнэлтийг баталж байна.

Эдийн засгийн сайн сайхан байдлын мэдрэмж (PEW) болон цалингийн тэгш байдал (PWA) хосолсон - энэ бол эдийн засгийн асуудлын блок юм. Карьер(CR) болон хувийн зорилго, байгууллагын зорилго (SOLs) -ийн хослолыг мөн хослуулсан болно.

Бусад кластерын аргууд, түүнчлэн өөр төрлийн зайг сонгох нь дендрограммыг мэдэгдэхүйц өөрчлөхөд хүргэдэггүй.

Үр дүн:

  1. Кластер шинжилгээ нь аливаа сэдвийн хүрээнд эрэл хайгуулын өгөгдөлд дүн шинжилгээ хийх, статистик судалгаа хийх хүчирхэг хэрэгсэл юм.
  2. Statistica хөтөлбөр нь шаталсан болон хоёуланг нь хэрэгжүүлдэг бүтцийн аргуудкластерийн шинжилгээ. Энэхүү статистикийн багцын давуу тал нь тэдний график чадамжтай холбоотой юм. Судалгаанд хамрагдсан хувьсагчдын орон зайд олж авсан кластеруудын хоёр хэмжээст ба гурван хэмжээст график дүрслэл, түүнчлэн объектуудыг бүлэглэх шаталсан журмын үр дүнг өгсөн болно.
  3. Кластер шинжилгээний хэд хэдэн алгоритмыг хэрэглэж, алгоритмын үр дүнгийн ерөнхий үнэлгээнд үндэслэн дүгнэлт гаргах шаардлагатай.
  4. Хэрэв кластер шинжилгээ хийвэл амжилттай болсон гэж үзэж болно янз бүрийн арга замууд, үр дүнг харьцуулж, ерөнхий зүй тогтлыг олдог, түүнчлэн кластер хийх аргаас үл хамааран тогтвортой кластерууд олддог.
  5. Кластер шинжилгээ нь асуудлын нөхцөл байдлыг тодорхойлж, тэдгээрийг шийдвэрлэх арга замыг тоймлох боломжийг олгодог. Иймд параметрийн бус статистикийн энэ аргыг системийн шинжилгээний салшгүй хэсэг гэж үзэж болно.

Мэдээлэлд дүн шинжилгээ хийх, хүлээн зөвшөөрөх орчин үеийн практик аргуудыг ашиглах нь техникийн болон хүмүүнлэгийн салбар, шинжлэх ухаан, үйлдвэрлэл, бизнес, санхүүгийн салбарт эрэлт хэрэгцээтэй байна. Энэхүү тайлбар нь алгоритмын үндсэн мөн чанарыг харуулсан бөгөөд үүнийг ойлгох нь илүү их хэрэг болно үр дүнтэй ашиглахмэдээллийн шинжилгээнд таних, ангилах аргууд.

1. Хүлээн зөвшөөрөх даалгавар (багштай хамт ангилах) ба түүнийг шийдвэрлэх практик аргын салбарын орчин үеийн байдал. Таних онол, практикийг хөгжүүлэх үндсэн үе шатууд: эвристик алгоритмыг бий болгох, таних загвар ба загварыг оновчтой болгох, загварыг засах алгебрийн арга. Үндсэн аргууд нь тусгаарлах гадаргуу, боломжит функцууд, модыг шийддэг статистик болон мэдрэлийн сүлжээний загварууд болон бусад зүйлс дээр суурилдаг.

ОХУ-ын ШУА-ийн Тооцоолох төвд боловсруулсан хослол-логик таних аргын үндсэн хандлага, алгоритмууд (тооцоолол эсвэл хэсэгчилсэн давуу эрхийн зарчимд суурилсан алгоритмыг тооцоолох загвар). А.А. Дородницын. Эдгээр загварууд нь анхны өгөгдлийн онцлог шинж чанаруудын (онцлогын утгын мэдээллийн фрагмент эсвэл төлөөллийн багц) тодорхой хэсгийг хайх санаан дээр суурилдаг. Бодит шинж чанаруудын хувьд мэдээллийн фрагментуудын оновчтой хорооллуудыг олдог. Өөр нэг нэр томъёонд эдгээр хэсэгчилсэн тохиолдлыг мэдлэг эсвэл логик хэв маяг гэж нэрлэдэг бөгөөд энэ нь анхны шинж чанаруудын утгыг танигдах эсвэл урьдчилан таамаглах боломжтой утгатай холбодог. Олдсон мэдлэг нь объектын судлагдсан ангиллын (зураг) чухал мэдээлэл юм. Эдгээрийг таних эсвэл урьдчилан таамаглах асуудлыг шийдвэрлэхэд шууд ашигладаг бөгөөд эдгээр өгөгдөлд байгаа харилцан хамаарлын дүрслэлийг өгдөг бөгөөд энэ нь судлаачдад бие даасан үнэ цэнэтэй бөгөөд объект, нөхцөл байдлын үнэн зөв загварыг бий болгох үндэс суурь болж чадна. , судалж буй үзэгдэл эсвэл үйл явц. Олдсон мэдлэгийн үндсэн дээр шинж чанар, объектын ач холбогдлын зэрэг (мэдээллийн байдал), шинж чанаруудын логик хамаарал, объектын ангиллын логик тайлбар зэрэг ашигтай хэмжигдэхүүнүүдийн утгыг тооцоолж, орон зайн шинж чанарын асуудлыг гаргадаг. багасгах асуудлыг шийдэж байна.

2. Кластерийн шинжилгээний гол асуудлыг шийдвэрлэх аргууд (багшгүйгээр ангилах) - олон хэмжээст өгөгдлийн өгөгдсөн түүвэр дэх объектуудын бүлэглэл (кластер) олох. авчирсан богино тоймкластерийн шинжилгээний асуудлыг шийдвэрлэх үндсэн аргууд, хамтын шийдлүүдийг нэгтгэх хорооны аргын тайлбар.

3. Програм хангамжийн системөгөгдөл олборлох, таних, урьдчилан таамаглах ТАНИЛЦАХ. Системд тавигдах шаардлагууд нь түгээмэл байдал, оюун ухааны санаан дээр суурилдаг. Системийн түгээмэл байдал нь түүнийг хамгийн өргөн хүрээний даалгаварт (өгөгдлийн хэмжээ, төрөл, чанар, бүтцийн хувьд, тооцоолсон утгын хувьд) ашиглах боломжийг гэж ойлгодог. Оюун ухаан гэдэг нь өөрийгөө тохируулах элементүүд байгаа эсэх, чадваргүй хэрэглэгчийн асуудлыг автоматаар амжилттай шийдвэрлэх чадвар гэж ойлгогддог. ТАНИЛЦАХ системийн хүрээнд шугаман, комбинатори-логик, статистик, мэдрэлийн сүлжээ, эрлийз аргуудыг урьдчилан таамаглах, ангилах, урьдчилан таамаглах, ангилах, хамтын таамаглал, ангилах аргуудыг хэрэгжүүлсэн программуудын номын санг боловсруулсан.


1. Тооцооллын тооцоонд үндэслэсэн таних алгоритмууд.Хүлээн зөвшөөрөгдсөн объектыг янз бүрийн шинж чанарын дагуу жишиг объекттой харьцуулах, санал өгөх журмыг ашиглах үндсэн дээр хүлээн зөвшөөрнө. Хамгийн оновчтой параметрүүд шийдвэрлэх дүрэмхүлээн зөвшөөрөх загварыг оновчтой болгох асуудлын шийдлээс санал хураах журам олддог - ийм параметрийн утгыг хүлээн зөвшөөрөх нарийвчлал (сургалтын дээж дэх зөв хариултын тоо) хамгийн их байхаар тодорхойлогддог.

2. Үхсэн тестүүд дээр санал өгөх алгоритмууд.Хүлээн зөвшөөрөгдсөн объектыг лавлагаатай харьцуулах нь янз бүрийн "мэдээллийн" дэд шинж чанаруудын дагуу хийгддэг. Анхны загварын хүснэгтийн янз бүрийн санамсаргүй дэд хүснэгтүүдийн үхсэн төгсгөлийн тестийг (эсвэл бодит үнэ цэнэтэй шинж чанаруудын төгсгөлийн тестийн аналогийг) ийм функцийн дэд систем болгон ашигладаг.

Сургалтын дээж дээр үндэслэн анги бүрийн логик хэв маягийн багцыг тооцдог - анги тус бүрийн онцлог шинж чанаруудын багц ба тэдгээрийн утгын интервалууд. Шинэ объектыг танихдаа хүлээн зөвшөөрөгдсөн объект дээр хийгдсэн анги бүрийн логик хэв маягийн тоог тооцоолно. Хувь хүний ​​"цаазын ял" бүрийг тухайн ангийнханд өгсөн "санал" гэж тооцдог. Объект нь ангилалд хамаарах бөгөөд "саналын" нормчлогдсон хэмжээ нь дээд тал нь юм. Энэ арга нь функцийн жин, онцлогуудын логик хамаарлыг үнэлэх, ангиудын логик тайлбарыг бий болгох, функцын хамгийн бага дэд орон зайг олох боломжийг олгодог.

4. Статистикийн жигнэсэн санал хураалтын алгоритмууд.

Сургалтын түүврийн өгөгдөл дээр үндэслэн ангиудын статистик үндэслэлтэй логик хэв маягийг олно. Шинэ объектыг танихдаа анги тус бүрт хамаарах объектын магадлалын тооцоог гаргадаг бөгөөд энэ нь "саналын" жигнэсэн нийлбэр юм.

5. Шугаман машин.

Объектуудын ангилал бүрийн хувьд шугаман функц олддог. Хүлээн зөвшөөрөгдсөн объект нь тухайн объект дээр функц нь хамгийн их утгыг авдаг ангилалд хамаарна. Сургалтын түүврээс үүссэн шугаман тэгш бус байдлын системийн хамгийн дээд хамтарсан дэд системийг олох асуудлыг шийдсэний үр дүнд ангиудын оновчтой шугаман функцуудыг олдог. Үүний үр дүнд сургалтын дээжийн элементүүдийн хамгийн их тоог зөв тусгаарлах тусгай хэсэгчилсэн шугаман гадаргуу олддог.

6. Фишерийн шугаман дискриминант.

Сонгодог статистикийн аргаангиудыг тусгаарлах хэсэгчилсэн шугаман гадаргууг барих. Фишерийн шугаман дискриминантыг ашиглах таатай нөхцөл нь дараахь хүчин зүйлсийн биелэлт юм: ангиудын шугаман салгах чадвар, дихотоми, ангиудын "энгийн бүтэц", ковариацын матрицын доройтолгүй байдал, хэт давчуу байдал байхгүй байна. Фишерийн шугаман дискриминантын бүтээгдсэн өөрчлөлт нь үүнийг "тааламжгүй" тохиолдолд амжилттай ашиглах боломжтой болгодог.

7. k-хамгийн ойрын хөршүүдийн арга.

Статистикийн сонгодог арга. Таних объект нь хамгийн олон хөрштэй ангилалд хамаарна. Хөршүүдийн оновчтой тоо, априори ангиллын магадлалыг сургалтын дээжээс тооцоолсон болно.

8. Буцах тархалттай мэдрэлийн сүлжээг таних загвар

Загвар танихад мэдрэлийн сүлжээг сургах сайн мэддэг аргын өөрчлөлт (буцах тархалтын арга) бүтээгдсэн. Мэдрэлийн сүлжээний одоогийн параметрүүдийн чанарын шалгуурын хувьд гаралтын дохионы утгын квадрат хазайлтын нийлбэр, шаардлагатай хэмжээнээс гарсан буруу ангиллын тоог хоёуланг нь харгалзан үздэг эрлийз шалгуурыг ашигладаг. сургалтын багц.

9.Вектор машиныг дэмжих.

Туслах векторуудыг ашиглан шугаман бус тусгаарлах гадаргууг бүтээх арга. Шинэ функцийн орон зайд (шулуулалтын орон зай) шугамантай ойролцоо хуваах гадаргуу баригдсан. Энэ гадаргуугийн барилгын ажил нь квадрат програмчлалын асуудлыг шийдвэрлэхэд багассан.

10. Төрөл бүрийн таних алгоритмын багуудаар таних асуудлыг шийдвэрлэх алгоритмууд.

Таних асуудлыг хоёр үе шаттайгаар шийддэг. Нэгдүгээрт, системийн өөр өөр алгоритмуудыг бие даан ашигладаг. Дараа нь тусгай аргууд - "засварлагч" ашиглан автоматаар оновчтой хамтын шийдлийг олдог. Төрөл бүрийн аргыг залруулах арга болгон ашигладаг.

11. Кластер шинжилгээний аргууд (автомат ангилал эсвэл хяналтгүй суралцах).

Дараах мэдэгдэж буй аргуудыг ашигладаг.

Шаталсан бүлэглэх алгоритмууд;

Квадрат хазайлтын нийлбэрийг багасгах шалгуураар кластер хийх;

k- гэсэн утгатай арга.

Ангиллын асуудлыг тухайн болон үл мэдэгдэх тооны ангийн аль алинд нь шийдвэрлэх боломжтой.

12. Ангиллын асуудлын хамтын шийдлийг бий болгох алгоритм.

Ангиллын асуудлыг хоёр үе шаттайгаар шийддэг. Эхлээд багц байна янз бүрийн шийдэл(бүрхүүл эсвэл хуваалт хэлбэрээр) Системийн янз бүрийн алгоритмуудыг ашиглан тогтмол тооны ангиудтай. Дараа нь тусгай дискрет оновчлолын асуудлыг шийдсэний үр дүнд оновчтой хамтын ангиллыг олно.

10.2. Өгөгдөл олборлолт ( Өгөгдөл Уул уурхай )

Зохицуулалтын хүрээ нь өмнөх хоёроос ялгаатай бөгөөд үүнд хуримтлагдсан мэдээлэл байдаг мэдээлэлд автоматаар ерөнхийлдөг, үүнийг тодорхойлж болно МЭДЛЭГЭЭР.

Өгөгдлийн олборлолт (DM) технологи нь сүүлийн арван жилд өөрийн байр сууриа эзэлж, бизнесийн олон салбарт голлох байр суурийг эзэлсээр байна.

    Бид бүгд өдөрт хэдэн арван удаа Data Mining програмд ​​хамрагддаг захидлын жагсаалт, дэлгүүрт уралдаан тэмцээн, гудамжинд үнэгүй сонин хүлээн авахмөн програмаар дуусгавар болно залилан илрүүлэх алгоритмууд,зээлийн картаар хийсэн аливаа худалдан авалтад дүн шинжилгээ хийх .

    Өгөгдөл олборлох аргыг өргөнөөр ашиглах болсон шалтгаан нь: тэд сайн үр дүнг өгдөг.Технологи нь байгууллагын зорилгодоо хүрэх чадварыг ихээхэн нэмэгдүүлэх боломжтой.

    Хэрэгсэл сайжирч, өргөн хэрэглэгдэх тусам түүний нэр хүнд өссөөр байна. хямд, хэрэглэхэд хялбар.

Өгөгдөл олборлолт (DIA) гэж орчуулагдсан хоёр нэр томъёо байдаг - эдгээр нь Өгөгдлийн сан дахь мэдлэгийг илрүүлэх (KDD) ба Өгөгдлийн олборлолт (DM) юм.

Өгөгдлийн олборлолтхайх үйл явц юм түүхий өгөгдөл 1) янз бүрийн 2) математик, статистикийн алгоритмуудаар дамжуулан харилцан хамаарал, чиг хандлага, харилцаа холбоо, хэв маяг.

    IAD-ийн ихэнх аргуудыг анх 1970-1080-аад онд хиймэл оюун ухааны онолын хүрээнд боловсруулсан. Гэвч 1990-ээд онд их хэмжээний, хурдацтай өсөн нэмэгдэж буй корпорацийн мэдээллийн боловсруулалтыг оюун ухаанжуулах асуудал нь тэдгээрийг мэдээллийн агуулахын нэмэлт болгон ашиглах шаардлагатай болсон үед л өргөн тархсан.

Энэ хайлтын зорилго(IAD үе шатууд) -

        1) Бизнесийн үйл явцыг тодорхой тусгасан байдлаар өгөгдөл бэлтгэх.

        2) Бизнес төлөвлөлтөд чухал ач холбогдолтой үйл явцыг урьдчилан таамаглахад ашиглаж болох загваруудыг бий болгох:

        • (2а) загварын баталгаажуулалт, үнэлгээ хийх;

        3) Шийдвэр гаргахын тулд түүхэн өгөгдөлд дүн шинжилгээ хийх:

        • (3а) загварыг сонгох, хэрэглэх;

          (3б) загваруудыг засах, шинэчлэх.

IAD-ийн даалгаврыг гаргаж авсан мэдээллийн төрлөөр ангилах

Ихэнх тохиолдолд IAD-ийн даалгаврын ангиллыг үйлдвэрлэсэн мэдээллийн төрлөөс хамааран гүйцэтгэдэг. Өгөгдлийн уурхайн даалгаврууд (загварууд) нь 2 ангилалд хуваагддаг.

    (1) урьдчилан таамаглах загваруудтэдний тусламжтайгаар тоон шинж чанарын утгыг урьдчилан таамаглах.

    (2) дүрслэх (дүрслэх) загварууд, дүрсэлсэн ерөнхий хэв маягсэдвийн хэсэг.

Эхний ангийн хамгийн тод төлөөлөгч бол ангиллын даалгавар юм.

1. Ангилал- энэ бол шинж тэмдгийг тодорхойлох, бүлгийг тодорхойлдог дүрмийн багц юм.

IAD-ийн хамгийн нийтлэг ажил. Энэ нь зөвшөөрдөг ижил төстэй бүлгүүдийн объектын шинж чанарыг тодорхойлох(ангиуд), ингэснээр эдгээр шинж чанаруудын мэдэгдэж буй утгыг нэг ангид шинэ объекттой холбож болно.

    Ангиллын ердийн хэрэглээний тохиолдол - тодорхой бүлгийн үйлчлүүлэгчдэд зориулсан бараа, үйлчилгээ нийлүүлэгчдийн хоорондын өрсөлдөөн. Ангилал нь өөр ханган нийлүүлэгч рүү шилжих хандлагатай тогтворгүй хэрэглэгчдийн шинж чанарыг тодорхойлоход тусалдаг бөгөөд энэ нь тэднийг энэ алхамаас зайлсхийх хамгийн сайн стратегийг олох боломжийг олгодог (хөнгөлөлт үзүүлэх, урамшуулах, эсвэл бүр дамжуулан бие даасан ажил"эрсдлийн бүлгүүдийн" төлөөлөгчидтэй ).

Ангиллын загварын тусламжтайгаар дараахь ажлуудыг шийддэг.

    шинэ үйлчлүүлэгч одоо байгаа ангиудын аль нэгэнд хамаарах эсэх;

    тодорхой эмчилгээний курс өвчтөнд тохирсон эсэх;

    найдваргүй үйлчлүүлэгчдийн бүлгийг тодорхойлох;

    шинэ бүтээгдэхүүний каталогийг илгээх ёстой хэрэглэгчдийн бүлгийг тодорхойлох.

Ангиллын асуудлыг шийдвэрлэх аргуудын хувьд дараахь зүйлийг ашиглаж болно.

      Залхуу сурах алгоритмууд, үүнд хамгийн ойрын хөрш (En ойрын хөрш) болон k-хамгийн ойрын хөрш (k-хамгийн ойрын хөрш) алгоритмууд,

      Bayesian сүлжээ эсвэл мэдрэлийн сүлжээ.

      шийдвэрийн модыг ашиглан ангилах;

      дэмжих вектор машинаар ангилах;

      статистикийн аргууд, ялангуяа шугаман регресс;

      CBR аргаар ангилах;

      генетикийн алгоритм ашиглан ангилах.

Математикийн аргыг ашиглан ангилахын тулд заавал байх шаардлагатай объектын албан ёсны тайлбар, ангиллын математикийн аппарат ашиглан ажиллах боломжтой. Энэ тодорхойлолт нь ихэвчлэн байдаг мэдээллийн сан. Объект бүр (мэдээллийн сангийн бүртгэл) тухайн объектын зарим өмчийн талаарх мэдээллийг агуулдаг. Анхны өгөгдлийн багц нь хоёр багцад хуваагдана: сургалт, туршилт.

        Сургалтын багц (сургалттогтоосон) - загварыг сургах (бүтээх) өгөгдлүүдийг агуулсан багц.

        Туршилт (тесттогтоосон) маш ихзагварын гүйцэтгэлийг шалгахад ашигладаг.

Сургалт, тестийн багцад хуваах нь дээжийг тодорхой хувь хэмжээгээр хуваах замаар хийгддэг, жишээлбэл, сургалтын багц нь мэдээллийн гуравны хоёр, тестийн багц нь мэдээллийн гуравны нэг юм.. Энэ аргыг олон тооны жишээнүүдийг сонгоход ашиглах нь зүйтэй. Хэрэв дээж нь бага хэмжээний эзэлхүүнтэй бол сургалтын болон туршилтын дээж нь хэсэгчлэн давхцаж болох тусгай аргыг ашиглахыг зөвлөж байна.

Ангилах үйл явц нь загвар бүтээх, ашиглах гэсэн хоёр үе шатаас бүрдэнэ.

    Загварын бүтэц: урьдчилан тодорхойлсон ангиудын багцын тодорхойлолт.

Жишээ өгөгдлийн багц бүр нь урьдчилан тодорхойлсон нэг ангид хамаарна.

Энэ үе шатанд сургалтын багцыг ашиглаж, түүн дээр загварыг бий болгодог. Үүссэн загварыг ангиллын дүрэм, шийдвэрийн мод эсвэл математикийн томъёогоор илэрхийлнэ.

    Загвар ашиглах: Шинэ эсвэл үл мэдэгдэх утгыг ангилах.

Загварын зөв (нарийвчлал) -ын үнэлгээ.

        A) Туршилтын жишээнээс мэдэгдэж буй утгыг гарсан загварыг ашиглах үр дүнтэй харьцуулна.

        B) Нарийвчлалын түвшин - тестийн багц дахь зөв ангилагдсан жишээнүүдийн хувь.

        C) Туршилтын багц, өөрөөр хэлбэл. баригдсан загварыг турших багц нь сургалтын багцаас хамаарах ёсгүй.

Загварын үр дүнгийн нарийвчлал нь хүлээн зөвшөөрөгдөхүйц байвал анги нь тодорхойгүй шинэ жишээнүүдийг ангилахад уг загварыг ашиглах боломжтой.

Ангиллын нарийвчлал: Алдааны түвшний тооцоо

Ангиллын нарийвчлалыг хөндлөн баталгаажуулалтыг ашиглан үнэлж болно. Хөндлөнгийн баталгаажуулалтнь туршилтын багцын өгөгдлийн ангиллын үнэн зөвийг үнэлэх журам бөгөөд үүнийг хөндлөн баталгаажуулалтын багц гэж нэрлэдэг. Туршилтын багцын ангиллын нарийвчлалыг сургалтын багцын ангиллын нарийвчлалтай харьцуулна. Хэрэв туршилтын багцын ангилал нь сургалтын багцын ангилалтай ойролцоо нарийвчлалын үр дүнг өгч байвал загварыг хөндлөн баталгаажуулсан гэж үзнэ.

Хоёрдугаар ангийн хамгийн тод төлөөлөгчид бол бөөгнөрөл, холбоо, дараалал гэх мэт асуудлууд юм.

Цагаан будаа. Ангилал ба кластерийн асуудлыг харьцуулах

2. Кластер хийх- энэ болнэгэн төрлийн өгөгдлийн бүлгүүдийг сонгох.

Ангилах санааг логикоор үргэлжлүүлж байна Ангиуд нь өөрөө урьдчилан тодорхойлогдоогүй тохиолдолд илүү төвөгтэй тохиолдол байдаг.Кластер хийх аргыг хэрэглэсний үр дүн нь судалж буй өгөгдөлд хамаарах бүлгүүдэд хуваах (чөлөөт хайлтын тусламжтайгаар) яг тодорхой тодорхойлолт юм.

    Дээрх жишээнд"Эрсдлийн бүлгүүд" - өөр нийлүүлэгч рүү явахад бэлэн байгаа хэрэглэгчдийн ангилал - тусламж үйлчилгээний үйл явц эхлэхээс өмнө бөөгнөрөл хийх арга хэрэгслийг тодорхойлж болох бөгөөд энэ нь нөхцөл байдлыг яаралтай засахаас илүүтэйгээр асуудлаас урьдчилан сэргийлэх боломжийг олгоно.

Ашигласан аргуудын хувьд -тусгай төрлийн мэдрэлийн сүлжээний "багшгүй" сургалт - Кохонен сүлжээ, түүнчлэн дүрмийг нэвтрүүлэх. .

Кластер нь олон тооны объектыг нэгэн төрлийн бүлэгт (кластер эсвэл анги) хуваахад зориулагдсан. Хэрэв түүврийн өгөгдлийг шинж чанарын орон зайд цэг болгон харуулсан бол кластерын асуудал "цэгний кластер" гэсэн тодорхойлолт хүртэл буурна.

Кластерын зорилго нь одоо байгаа бүтцийг хайх явдал юм. Кластер хийх нь дүрслэх журам бөгөөд энэ нь ямар ч статистик дүгнэлт гаргадаггүй, гэхдээ хайгуулын шинжилгээ хийх, "өгөгдлийн бүтэц"-ийг судлах боломжтой болгодог.

"Кластер" гэсэн ойлголтыг хоёрдмол утгаар тодорхойлдог: судалгаа бүр өөрийн гэсэн "кластер"-тай байдаг. Кластер (кластер) гэсэн ойлголтыг "кластер", "баглаа" гэж орчуулдаг.

Кластерыг нийтлэг шинж чанартай объектуудын бүлэг гэж тодорхойлж болно.

Кластерын хоёр шинж чанар байдаг:

        дотоод нэг төрлийн байдал;

        гадаад тусгаарлалт.

Кластер байж болно давхцахгүй, эсвэл онцгой (давхцаагүй, онцгой), огтлолцох (давхцах).

Кластерын чанарын үнэлгээг дараахь журмын үндсэн дээр хийж болно.

    гараар шалгах;

    хяналтын цэгүүдийг бий болгох, үүссэн кластеруудыг шалгах;

    загварт шинэ хувьсагч нэмэх замаар кластерын тогтвортой байдлыг тодорхойлох;

    янз бүрийн аргыг ашиглан кластер үүсгэх, харьцуулах. Төрөл бүрийн аргуудбөөгнөрөл нь өөр өөр кластер үүсгэж болох бөгөөд энэ нь хэвийн үзэгдэл юм. Гэсэн хэдий ч ижил төстэй кластеруудыг өөр өөр аргаар бий болгох нь бөөгнөрөл нь зөв болохыг харуулж байна.

Маркетингийн судалгаанд кластер шинжилгээ

Маркетингийн судалгаанд кластерийн шинжилгээг нэлээд өргөн ашигладаг - онолын судалгаа, янз бүрийн объектуудыг бүлэглэх асуудлыг шийддэг маркетеруудын практикт аль алинд нь ашигладаг. Үүний зэрэгцээ үйлчлүүлэгчдийн бүлэг, бүтээгдэхүүн гэх мэт асуултууд шийдэгддэг.

Маркетингийн судалгаанд кластерийн шинжилгээг ашиглах хамгийн чухал ажлуудын нэг юм хэрэглэгчийн зан төлөвийн шинжилгээ, тухайлбал:

    Бүлэг тус бүрээс үйлчлүүлэгчийн зан байдал, түүний зан төлөвт нөлөөлж буй хүчин зүйлсийн талаархи бүрэн дүр зургийг олж авахын тулд хэрэглэгчдийг нэг төрлийн ангилалд хуваах.

Кластерийн шинжилгээгээр шийдэж чадах чухал ажил бол байрлал тогтоох, i.e. шинэ бүтээгдэхүүнийг байрлуулах цэгийг тодорхойлохзах зээл дээр санал болгож байна. Кластер шинжилгээг хэрэглэсний үр дүнд тодорхойлоход ашиглаж болох газрын зургийг бүтээдэг зах зээлийн янз бүрийн сегмент дэх өрсөлдөөний түвшинЭнэ сегментэд орох боломжийн хувьд тухайн бүтээгдэхүүний холбогдох шинж чанарууд. Ийм газрын зураг дээр дүн шинжилгээ хийснээр энэ нь боломжтой юм зах зээл дээр шинэ, эзэнгүй торуудыг тодорхойлохТа одоо байгаа бүтээгдэхүүнээ санал болгох эсвэл шинийг хөгжүүлэх боломжтой.

Кластер шинжилгээ нь бас ашигтай байж болно, жишээлбэл, компанийн үйлчлүүлэгчдэд дүн шинжилгээ хийх. Үүнийг хийхийн тулд бүх үйлчлүүлэгчдийг кластер болгон нэгтгэж, кластер болгонд тус тусад нь бодлого боловсруулдаг. Энэхүү арга нь шинжилгээний объектуудыг мэдэгдэхүйц багасгах, үүнтэй зэрэгцэн үйлчлүүлэгчдийн бүлэг бүрт тус тусад нь хандах боломжийг олгодог.

3. Холбооны дүрэм- холбогдох үйл явдлуудыг хайх.

Холбоо нь нэг объект эсвэл үйл явдлын өмчийн утгыг үндэслэн тодорхойлогддоггүй, гэхдээ байдаг хоёр ба түүнээс дээш нэгэн зэрэг үйл явдлын хооронд байрлуулах. Үүний зэрэгцээ, үйлдвэрлэсэн дүрмүүд нь нэг үйл явдал тохиолдоход нөгөө нь янз бүрийн магадлалтайгаар тохиолддог гэдгийг харуулж байна. Тоон хувьд, нэгдлийн хүчийг хэд хэдэн хэмжигдэхүүнээр тодорхойлдог; жишээлбэл, дараах гурван шинж чанарыг ашиглаж болно.

    а) урьдчилан таамаглах чадвар) X үйл явдлын нийт тооны хувиар X ба Y үйл явдал хэр олон удаа тохиолдохыг тодорхойлдог;

Тиймээс, зурагт (X) худалдаж авах тохиолдолд VCR-ийг 65% тохиолдолд (Y) нэгэн зэрэг худалдаж авдаг;

    б) тархалт (тархалт) X ба Y үйл явдлууд нэгэн зэрэг тохиолдох нь бүртгэгдсэн үйл явдлын нийт мөчүүдийн тоотой харьцуулахад хэр олон удаа тохиолддогийг харуулдаг;

Өөрөөр хэлбэл, бүх худалдан авалтын дунд зурагт болон VCR-ийг нэгэн зэрэг худалдаж авах нь хэр олон байдаг вэ;

    в) хүлээгдэж буй таамаглалүйл явдлын хоорондын хамаарал байхгүй үед үүсэх урьдчилан таамаглах чадварыг харуулдаг;

Жишээлбэл, зурагт худалдаж авсан эсэхээс үл хамааран VCR-ийг хэр олон удаа худалдаж авах вэ?

4. Дараалал илрүүлэх- цаг хугацаанд нь холбогдсон үйл явдлын хэлхээг хайх.

Холбооны нэгэн адил үйл явдлуудын хооронд дараалал үүсдэг, гэхдээ нэгэн зэрэг тохиолддоггүй, гэхдээ тодорхой хугацааны завсарлагатай байдаг. Тиймээс холбоо нь тэг хугацааны хоцрогдолтой дарааллын онцгой тохиолдол юм.

Хэрэв VCR-ийг зурагттай хамт худалдаж аваагүй бол шинэ зурагт худалдаж авснаас хойш нэг сарын дотор VCR худалдан авалтыг тохиолдлын 51% -д хийдэг.

5. Урьдчилан таамаглах- системийн зан үйлийн динамикийг хангалттай тусгасан хэв маягийг олох оролдлого, жишээлбэл. түүхэн мэдээлэлд үндэслэн ирээдүйн системийн үйл ажиллагааг урьдчилан таамаглах .

Одоогийн болон түүхэн өгөгдлийн зан төлөвт үндэслэн тодорхой тоон үзүүлэлтүүдийн ирээдүйн утгыг тооцдог урьдчилан таамаглах хэлбэр.

Энэ төрлийн асуудлуудад математик статистикийн уламжлалт аргууд, түүнчлэн мэдрэлийн сүлжээг ихэвчлэн ашигладаг.

Урьдчилан таамаглах (Грекийн прогнозоос),өргөн утгаар нь ирээдүйн тэргүүлэгч тусгал гэж тодорхойлсон. Урьдчилан таамаглах зорилго нь ирээдүйн үйл явдлыг урьдчилан таамаглах явдал юм.

Урьдчилан таамаглах асуудлын шийдэл нь дараахь дэд даалгавруудыг шийдвэрлэхэд хүргэнэ.

    урьдчилан таамаглах загварыг сонгох;

    боловсруулсан урьдчилсан таамаглалын хүрэлцээ, үнэн зөв байдалд дүн шинжилгээ хийх.

Ангилал ба урьдчилан таамаглах даалгавар - ижил төстэй байдал ба ялгаа.

Тэгэхээр урьдчилан таамаглах болон ангилах асуудлуудын хооронд ямар төстэй зүйл байдаг вэ??

Хоёр асуудал хоёулаа сургалтын багцаас загвар гаргаж, хамааралтай хувьсагчийн үл мэдэгдэх утгыг таамаглахад ашиглах хоёр үе шаттай процессыг ашигладаг.

Ангилал ба урьдчилан таамаглах асуудлын ялгааЭнэ нь эхний даалгаварт хамааралтай хувьсагчийн ангиллыг урьдчилан таамагласан, хоёрдугаарт - орхигдсон эсвэл үл мэдэгдэх (ирээдүйтэй холбоотой) хамааралтай хувьсагчийн тоон утгуудаас бүрддэг.

Жишээлбэл, аялал жуулчлалын агентлагийг авч үзэхэд үйлчлүүлэгчийн ангиллыг тодорхойлох нь ангиллын асуудлыг шийдэх шийдэл бөгөөд энэ үйлчлүүлэгч ирэх онд ирэх орлогыг урьдчилан таамаглах нь таамаглалын асуудлыг шийдэх шийдэл болно.

Урьдчилан таамаглах үндэс нь мэдээллийн санд хадгалагдсан түүхэн мэдээлэл юм хугацааны цуваа.

Цаг хугацааны цуваа ба ажиглалтын энгийн дарааллын хоёр үндсэн ялгаа:

    Санамсаргүй түүврийн гишүүдээс ялгаатай нь цаг хугацааны цувралын гишүүд, статистикийн хувьд хараат бус байна.

    Цагийн цувралын гишүүд тэгш хуваарилагдаагүй байна.

Тренд, улирлын шинж чанар, мөчлөг

Хугацааны цувааны гол бүрэлдэхүүн хэсэг нь чиг хандлага ба улирлын бүрэлдэхүүн хэсэг юм.

Тренд нь цаг хугацааны явцад өөрчлөгдөж болох хугацааны цувралын системчилсэн бүрэлдэхүүн хэсэг юм. Тренд нь санамсаргүй бус функц юм, энэ нь цаг хугацааны цувралд нөлөөлж буй ерөнхий эсвэл урт хугацааны чиг хандлагын нөлөөн дор үүсдэг.

Хугацааны цувааны улирлын бүрэлдэхүүн хэсэг нь үе үе давтагддаг бүрэлдэхүүн хэсэг юм. Улирлын шинж чанартай гэсэн үгойролцоогоор тэнцүү хугацааны интервалд хамааралтай хувьсагчийн зан төлөвийг дүрсэлсэн муруй хэлбэр нь түүний онцлог хэлбэрийг давтдаг.

Улирлын шинж чанар нь урьдчилан таамаглахад ашиглах түүхэн мэдээллийн хэмжээг тодорхойлоход чухал ач холбогдолтой.

Цувралын улирлын бүрэлдэхүүн хэсэг, байгалийн улирлын тухай ойлголтыг төөрөгдүүлэхгүй байх нь чухал юм.. Тэдний дуу чимээ ойрхон байгаа хэдий ч эдгээр ойлголтууд өөр өөр байдаг. Жишээлбэл, зуны улиралд зайрмагны борлуулалт бусад улирлаас хамаагүй өндөр байдаг ч энэ нь энэ бүтээгдэхүүний эрэлтийн хандлага юм!!!

Улирлын үеийн хугацааны цувралын фрагмент

Улирлын 12 үеийн хугацааны цувралын фрагмент

Урьдчилан таамаглах хугацаа- урьдчилан таамаглах цаг хугацааны үндсэн нэгж.

    Тухайлбал, компанийн нэг сарын орлогыг мэдмээр байна. Энэ даалгаврыг урьдчилан таамаглах хугацаа нь нэг сар байна.

Урьдчилан таамаглах хүрээЭнэ нь урьдчилсан таамаглалыг хамарсан ирээдүйн үеүүдийн тоо юм.

    Хэрэв урьдчилсан мэдээ нь 12 сарын өмнө, сар бүрийн өгөгдөлтэй бол энэ асуудлын урьдчилсан хугацаа нь нэг сар, урьдчилсан таамаглал нь 12 сар байна.

Урьдчилан таамаглах интервал- шинэ таамаглал гаргах давтамж.

    Урьдчилан таамаглах интервал нь таамаглах хугацаатай ижил байж болно.

Урьдчилан таамаглах нарийвчлал нь урьдчилсан мэдээний алдаагаар тодорхойлогддог.

Хамгийн түгээмэл алдааны төрлүүд:

    Дундаж алдаа (SD).Энэ нь алхам бүр дэх алдааг зүгээр л дундажлах замаар тооцоологддог. Энэ төрлийн алдааны сул тал нь эерэг ба сөрөг алдаанууд бие биенээ үгүйсгэдэг явдал юм.

    Дундаж үнэмлэхүй алдаа (MAE).Үүнийг үнэмлэхүй алдааны дундажаар тооцдог. Хэрэв тэгтэй тэнцүү бол бид төгс таамаглалтай болно. Стандарт алдаатай харьцуулахад энэ хэмжүүр нь хэт өндөр үзүүлэлтүүдэд "хэт их ач холбогдол өгдөггүй".

    Квадрат алдааны нийлбэр (SSE), язгуур дундаж квадрат алдаа. Үүнийг квадрат алдааны нийлбэр (эсвэл дундаж) гэж тооцдог. Энэ бол таамаглалын үнэн зөв байдлын хамгийн түгээмэл хэмжүүр юм.

    Харьцангуй алдаа (RO).Өмнөх хэмжүүрүүдэд алдааны бодит утгыг ашигласан. Харьцангуй алдаа нь тохирох чанарыг харьцангуй алдаагаар илэрхийлдэг.

6. Аномали- өгөгдөл дэх хэвийн бус утгыг илрүүлэх.

Тэдгээрийг тодорхойлох нь 1) өгөгдлийн алдаа, 2) урьд өмнө мэдэгдээгүй шинэ хэв маяг үүсэх, эсвэл 3) мэдэгдэж буй хэв маягийг тодруулах боломжийг олгодог.

airsoft-unity.ru - Уул уурхайн портал - Бизнесийн төрлүүд. Зааварчилгаа. Компаниуд. Маркетинг. татвар