Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

فصل هفتم شاخص گذاری.

Liknende presentasjoner


Presentasjon om: "فصل هفتم شاخص گذاری."— Utskrift av presentasjonen:

1 فصل هفتم شاخص گذاری

2 شاخص چیست؟ منظور از شاخص مجموعه اي از عناصر شاخص است كه به صورت جفت هاي(x , a ) از داده هايي با طول ثابت است كه به طور فيزيكي كنار هم قرار دارند . x نشانگر كليد و a نشانگر اطلاعات همراه با كليد است .

3 فرض مي كنيم خود شاخص انقدر بزرگ است كه تنها بخش كوچكي از آن را مي توان در يك لحظه در حافظه اصلي نگه داشت . بنا بر اين شاخص بايد در يك حافظه جانبي ذخيره شود . نوع حافظه جانبي دستگاه هايي با دستيابي شبه تصادفي است كه زمان دستيابي يا انتظار آنها نسبتا طولاني است .

4 هدف , پيدا كردن روش كلي براي ذخيره و بازيابي داده ها در سيستم هاي فايل بزرگ بود كه امكان دسترسي با حداقل زمان را فراهم سازد . مك كرايت در سال 1972 اولين مقاله خود را در رابطه با درخت Bمنتشر كرد . پس از آن درخت B به قدري گسترش يافت كه كومر اينگونه نوشت : « درخت B , به طور غير رسمي ساختار استانداردي براي شاخص بندي در بانكهاي اطلاعاتي به شمار مي رود» .

5 شاخص چند سطحی

6 مزیت شاخص ها بدون دستکاری محتویات فایل ,به فایل نظم و تر تیب می بخشند.

7 لازمه استفاده از الگوريتم جستجوي دودويي اين است كه بلاك هاي داده اي به طور پيوسته ذخيره شده باشند . اگر بلاك ها به طور ناپيوسته ذخيره و به هم پيوند شده باشند , يافتن آدرس بلاك مياني نا ممكن است .

8 با استفاده از تكنيكهاي ابتدايي ساختمان داده ها به آساني مي توانيم گره هايي را درست كنيم كه شامل فيلد هاي پيوندي چپ و راست باشند و به اين ترتيب درخت جستجوي دودويي را به صورت يك ساختار پيوندي ايجاد كنيم .

9 شكل زير را در نظر بگيريد :

10 مشكل درخت جستجوي دودويي اين است كه براي شاخص بندي روي ديسك سرعت لازم را ندارد . اما مشكل مهم ديگر درخت جستجوي دودويي , وجود نداشتن يك راهبرد موثر براي موازينه كردن درخت است براي حل اين مشكلات درختهاي AVL و در ختهاي دوديي صفحه صفحه به ميان آمدند

11 کاتالوگ کارتی چیست؟ مجموعه ای از سه شاخص است که هر کدام از یک فیلد کلید متفاوت استفاده می کنند وهمه آنها از یک شماره کاتالوگ یکسان به عنوان فیلد آدرس بهره می گیرند.

12 مقایسه سرعت دسترسی شاخص باعث می شود تا رکورد ها را به وسیله کلید آنها با سرعت زیادی ÷یدا کنیم .سرعت این کار در مقایسه با حالتی که جستجوی دودویی در یک فایل مرتب موجود در حافظه انجام می شود بیشتر است.

13 عملیات مورد نیاز برای نگهداری فایل شاخص بندی شده
ایجاد فایل داده ها و شاخص خالی اولیه باز کردن فایل شاخص در حافظه ,قبل از به کار گیری آن نوشتن فایل شاخص بر روی دیسک , پس از به کار گیری آن افزودن رکورد هایی به فایل داده ها حذف رکورد ها از فایل داده ها بهنگام کردن رکورد ها در فایل داده ها بهنگام کردن شاخص برای انعکاس تغییرات به عمل آمده در فایل داده ها

14 ایجاد فایل داده ها و شاخص خالی اولیه
دو فایل باید ایجاد شود: فایل داده ها برای نگهداری اشیائ داده ای فایل شاخص برای نگهداری کلید اولیه

15 باز کردن فایل شاخص در حافظه ,قبل از به کار گیری آن
بازیابی و ذخیره اشیاء توسط کلاس io buffer انجام می شود.

16 نوشتن فایل شاخص بر روی دیسک , پس از به کار گیری آن
یکی از خطرات مربوط به خواندن شاخص و نوشتن آن در پایان برنامه آن است که اگر برنامه متوقف شود کپی شاخص که بر روی دیسک است اعتبار ندارد.

17 برنامه باید حداقل دو مکانیسم زیر را برای محافظت از خطا داشته باشد
باید مکانیسمی باشد که به برنامه اطلاع دهد که شاخص در چه زمانی از رده خارج است اگر برنامه تشخیص دهد که شاخص از رده خارج است باید به روالی دستیابی داشته باشد که شاخص را از فایل داده ها بازسازی کند.

18 افزودن رکورد هایی به فایل داده ها
برای افزودن رکورد ها باید همه ورودی هایی را که کلید آنها پس از کلید ورودی جدید است , جابجا کنیم تا پس از این ورودی قرار گیرند.

19 حذف رکورد ها از فایل داده ها
بر خلاف یک فایل داده ای مرتب برای حفظ ترتیب رکورد ها نیاز به جابجایی آنها نیست.به وسیله کلید بدون اختلال در جای رکورد ها می توانیم با سرعت زیادی به رکورد ها دسترسی پیدا کنیم.

20 بهنگام کردن رکورد ها در فایل داده ها
بهنگام سازی به دو صورت انجام می شود: بهنگام سازی تعداد فیلد و کلید را تغییر می دهد بهنگام سازی بر فیلد کلید تا ثیر نمی گذارد.

21 بهینه سازی شیوه استاندارد برای انجام این کار افزودن نشانگری به شی شاخص استتا نشان دهد که چه زمانی تغییر کرده است. هنگامی که رکورد به حاففظه منتقل می شود به این نشانگر ارزش false داده می شود.و هرگاه رکورد شاخص توسط متد های remove و insert تغغییر داده شد به آن ارزش true داده می شود.

22 شاخص های بزرگ اگر شاخص بیش از حد بزرگ باشد در آن صورت دستیابی به شاخص و دستکاری آن باید در حافظه ثانویه صورت گیرد.

23 معایب دستیابی به شاخص روی دیسک
جستجوی دودویی شاخص به جای آنکه با سرعت حافظه صورت پذیرد نیاز به چندین پیگرد دارد. ترتیب مجدد شاخص که از حذف یا افزودن رکورد ناشی می شود نیاز به جابجا کردن یا مرتب سازی رکورد ها در حافظه ثانویه دارد که این کار بسیار گرانتر از اجرای این عملیات در حافظه است.

24 هرگاه شاخص در حافظه جا نشود باید از موارد زیر استفاده کرد:
در صورتی که سرعت دستیابی در اولویت قرار داشته باشد از درهم سازی استفاده شود در صورتی که به هر دو نوع دستیابی کلیدی و ترتیبی نیاز باشد از یک شاخص چند سطحی با ساختار درختی نظیر درخت B استفاده می شود.

25 نکته 1: شاخص ساده استفاده از جستجوی دودویی را برای دستیابی کلیدی به یک رکورد در فایلی که طول رکورد های آن متغییر است امکان پذیر می سازد.

26 نکته 2: اگر ورودی های شاخص بسیار کوچکتر از رکورد های فایل داده ها باشد مرتب سازی و نگهداری شاخص نسبت به مرتب سازی و نگهداری فایل داده ها زمان کمتری می برد.

27 نکته 3: اگر در فایل داده ها رکورد هایی وجود دارند که در جای خود مستقر هستند با استفاده از شاخص می توان ترتیب کلید ها را بدون جابجایی رکورد های داده ها عوض کرد.

28 افزودن رکورد هنگامی که شاخص ثانویه ای موجود باشد , افزودن یک رکورد به فایل به معنای افزودن یک ورودی شاخص ثانویه است.

29 نکته اختلاف مهم شاخص اولیه با ثانویه آن است که شاخص ثانویه می تواند حاوی کلید های دوگانه باشد.

30 حذف رکورد ها حذف یک رکورد به معنای حذف تمامی آدرس های آن رکورد در سیستم فایل است.

31 بهنگام سازی رکورد ها بهنگام سازی فایل داده ها فقط هنگامی شاخص ثانویه را تحت تا ثیر قرار می دهد که کلید اولیه یا ثانویه تغییر یابند

32 در بهنگام سازی سه وضعیت پیش می آید:
بهنگام سازی با عث تغییر کلید ثانویه می شود بهنگام سازی باعث تغییر کلید اولیه می شود بهنگام سازی محدود به فیلد های دیگر

33 ساختار های شاخص ثانویه دو مشکل دارند
هر بار که رکورد جدیدی به فایل افزوده می شود باید فایل شاخص را دوباره مرتب کنیم. اگر کلید های ثانویه وجود داشته باشد فیلد کلید ثانویه برای هر ورودی تکرار می شود.

34 انقیاد منظور از انقیاد این است که کلید در چه نقطه ای به آدرس فیزیکی رکورد مربوط به خود می پیوندد

35 در کل این فصل انقیاد کلید های اولیه به آدرس در زمان ایجاد شدن فایلها رخ می دهد.ولی کلید های ثانویه در زمان استفاده به آدرس خود پیوند می یابند.

36 نکته عیب انقیاد مستقیم در فایل آن است که سازمان دهی دوباره فایل داده ها باید منجر به اصلاح همه فایل های شاخص انقیاد یافته شود.

37 انقیاد درون داده ها هنگامی بهترین نتیجه را می دهد که:
فایل داده ها ایستا یا تقریبا ایستا باشد و نیاز کمی به حذف , اضافه یا بهنگام سازی داده ها داشته باشد. کارایی سریع طی بازیابی واقعی , از اولویت بالایی بر خوردار است.


Laste ned ppt "فصل هفتم شاخص گذاری."

Liknende presentasjoner


Annonser fra Google