هذه صفحة لقطة ثنائية اللغة تم حفظها بواسطة المستخدم في 2025-1-23 5:24 لـ https://app.immersivetranslate.com/pdf-pro/84da21a9-2eda-4cde-a04a-542c51ffaeb5، مقدمة بدعم ثنائي اللغة من قبل الترجمة الغامرة. تعلم كيفية الحفظ؟

Machine learning for an explainable cost prediction of medical insurance
التعلم الآلي للتنبؤ بتكاليف التأمين الطبي قابلة للتفسير

Ugochukwu Orji a ^("a "){ }^{\text {a }}, Elochukwu Ukwandu b,* b,*  ^("b,* "){ }^{\text {b,* }} أعد المحاولة    سبب الخطأ a ^("a "){ }^{\text {a }} Department of Computer Science, Faculty of Physical Science, University of Nigeria, Nsukka, Enugu State, Nigeria أعد المحاولة    سبب الخطأ b b ^(b){ }^{\mathrm{b}} Department of Applied Computing, Cardiff School of Technologies, Cardiff Metropolitan University, Cardiff, Wales CF5 2YB, United Kingdom أعد المحاولة    سبب الخطأ

A R T I C L E I N F O أعد المحاولة    سبب الخطأ

Keywords: أعد المحاولة    سبب الخطأ

Abstract أعد المحاولة    سبب الخطأ

Predictive modeling in healthcare continues to be an active actuarial research topic as more insurance companies aim to maximize the potential of Machine Learning (ML) approaches to increase their productivity and efficiency. In this paper, the authors deployed three regression-based ensemble ML models that combine variations of decision trees through Extreme Gradient Boosting (XGBoost), Gradient-boosting Machine (GBM), and Random Forest (RF) methods in predicting medical insurance costs. Explainable Artificial Intelligence (XAi) methods SHapley Additive exPlanations (SHAP) and Individual Conditional Expectation (ICE) plots were deployed to discover and explain the key determinant factors that influence medical insurance premium prices in the dataset. The dataset used comprised 986 records and is publicly available in the KAGGLE repository. The models were evaluated using four performance evaluation metrics, including R-squared ( R 2 R 2 R^(2)\mathrm{R}^{2} ), Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), and Mean Absolute Percentage Error (MAPE). The results show that all models produced impressive outcomes; however, the XGBoost model achieved a better overall performance although it also expanded more computational resources, while the RF model recorded a lesser prediction error and consumed far fewer computing resources than the XGBoost model. Furthermore, we compared the outcome of both XAi methods in identifying the key determinant features that influenced the PremiumPrices for each model and whereas both XAi methods produced similar outcomes, we found that the ICE plots showed in more detail the interactions between each variable than the SHAP analysis which seemed to be more high-level. It is the aim of the authors that the contributions of this study will help policymakers, insurers, and potential medical insurance buyers in their decision-making process for selecting the right policies that meet their specific needs.
لا تزال النمذجة التنبؤية في مجال الرعاية الصحية موضوعًا بحثيًا اكتواريًا نشطًا حيث تهدف المزيد من شركات التأمين إلى تعظيم إمكانات أساليب التعلم الآلي (ML) لزيادة إنتاجيتها وكفاءتها.في هذه الورقة ، نشر المؤلفون ثلاثة نماذج ML الجماعية القائمة على الانحدار التي تجمع بين الاختلافات في أشجار القرار من خلال تعزيز التدرج المتطرف (XGBost) ، وآلة تعزيز التدرج (GBM) ، والغابات العشوائية (RF) في التنبؤ بتكاليف التأمين الطبي.تم نشر أساليب الذكاء الاصطناعي القابلة للتفسير (XAI) ومؤامرات Shapley Additive Explanations (SHAP) والتوقعات المشروطة الفردية (ICE) لاكتشاف وشرح العوامل المحددة الرئيسية التي تؤثر على أسعار أقساط التأمين الطبي في مجموعة البيانات.تضم مجموعة البيانات المستخدمة 986 سجلًا وهي متاحة للجمهور في مستودع KAGGLE. تم تقييم النماذج باستخدام أربعة مقاييس لتقييم الأداء ، بما في ذلك R-squared ( R 2 R 2 R^(2)\mathrm{R}^{2} ) و Mean Absolute Error (MAE) و Root Mean Squared Error (RMSE) و Mean Absolute Percent Error (MAPE).أظهرت النتائج أن جميع النماذج أنتجت نتائج مثيرة للإعجاب ؛ ومع ذلك ، حقق نموذج XGBoost أداءً عامًا أفضل على الرغم من أنه وسع أيضًا المزيد من الموارد الحسابية ، في حين سجل نموذج RF خطأً أقل في التنبؤ واستهلك موارد حوسبة أقل بكثير من نموذج XGBost.وعلاوة على ذلك، قارنا نتائج كل من أساليب XAI في تحديد الميزات المحددة الرئيسية التي أثرت على PremiumPrices لكل نموذج، وبينما أنتجت كل من أساليب XAI نتائج مماثلة، وجدنا أن مؤامرات ICE أظهرت بمزيد من التفصيل التفاعلات بين كل متغير من تحليل SHAP الذي بدا أنه أكثر مستوى. يهدف المؤلفون إلى أن مساهمات هذه الدراسة ستساعد صناع السياسات وشركات التأمين ومشتري التأمين الطبي المحتملين في عملية صنع القرار لاختيار السياسات الصحيحة التي تلبي احتياجاتهم المحددة.

1. Introduction  1.مقدمة

In recent times, actuarial modeling of insurance claims has become a key research area in the health insurance sector and is mostly applied in setting effective premiums (Duncan et al., 2016). This is vital for attracting and retaining insureds and for efficient management of existing plan members. However, due to the variety of factors that drive medical insurance costs and the complexities therein, there is a bit of a challenge being faced in accurately building a predictive model for it. Factors like demographic information, health status, geographic access, lifestyle choices, provider characteristics, etc. all have the potential to have a dramatic impact on the expected costs of medical insurance. Other vital factors like the scope of coverage, type of plan, deductible, and the age of a customer when they sign up also play a major role in determining the potential cost of medical insurance.
في الآونة الأخيرة ، أصبحت النمذجة الاكتوارية لمطالبات التأمين مجالًا بحثيًا رئيسيًا في قطاع التأمين الصحي ويتم تطبيقه في الغالب في تحديد أقساط فعالة (دنكان وآخرون ،2016). .وهذا أمر حيوي لجذب المؤمن عليهم والاحتفاظ بهم ولإدارة أعضاء الخطة الحاليين بكفاءة.ومع ذلك ، نظرًا لمجموعة متنوعة من العوامل التي تدفع تكاليف التأمين الطبي والتعقيدات فيه ، هناك بعض التحديات التي تواجهها في بناء نموذج تنبؤي بدقة له. عوامل مثل المعلومات الديموغرافية ، والحالة الصحية ، والوصول الجغرافي ، وخيارات نمط الحياة ، وخصائص مقدم الخدمة ، وما إلى ذلك ، كلها لديها القدرة على أن يكون لها تأثير كبير على التكاليف المتوقعة للتأمين الطبي.تلعب العوامل الحيوية الأخرى مثل نطاق التغطية ونوع الخطة والقابلة للخصم وعمر العميل عند الاشتراك أيضًا دورًا رئيسيًا في تحديد التكلفة المحتملة للتأمين الطبي.
The importance of an effective and transparent medical insurance system cannot be overemphasized considering the need for universal
لا يمكن المغالاة في التأكيد على أهمية وجود نظام تأمين طبي فعال وشفاف بالنظر إلى الحاجة إلى توفير نظام تأمين طبي شامل.

healthcare coverage and the challenges thrown up by the COVID-19 pandemic (Orji et al., 2022b).
تغطية الرعاية الصحية والتحديات التي يطرحها وباء COVID-19 (Orji et al.٢٠٢٢ ب).
Orji et al., (2022a) described how the predictive analytics feature of ML has become the most utilized feature for industrial applications. The ongoing regulatory and market changes in the health industry continue to motivate actuarial research into predictive modeling in health care. ML algorithms have proven to yield accurate results in predicting high-cost, high-need patient expenditures, so insurance companies are increasingly turning to ML approaches to improve their policies and premium settings (Yang et al., 2018).
أورجي وآخرون،وصف (2022a) كيف أصبحت ميزة التحليلات التنبؤية لـ ML الميزة الأكثر استخدامًا للتطبيقات الصناعية.لا تزال التغيرات التنظيمية والسوقية المستمرة في صناعة الصحة تحفز البحوث الاكتوارية في النمذجة التنبؤية في مجال الرعاية الصحية.وقد أثبتت خوارزميات ML أنها تسفر عن نتائج دقيقة في التنبؤ بنفقات المرضى عالية التكلفة وذات الحاجة العالية ، لذلك تتحول شركات التأمين بشكل متزايد إلى نهج ML لتحسين سياساتها وإعداداتها المتميزة (يانغ وآخرون ،٢٠١٨).
However, the high performance of ML algorithms in healthcare, as noted by (Panay et al., 2019), is somewhat offset by their black-box nature. If the predictive analytics involving patients’ personal and clinical information is not well understood or explained, they could be prone to bias. Fortunately, the emergence of Explainable Artificial Intelligence (XAi) methods allows those involved - patients, healthcare managers, and insurers - to gain further insight into the logic behind
ومع ذلك ، فإن الأداء العالي لخوارزميات ML في الرعاية الصحية ، كما لاحظ (Panaay et al. ،2019) ، يقابلها إلى حد ما طبيعة الصندوق الأسود.إذا لم تكن التحليلات التنبؤية التي تنطوي على المعلومات الشخصية والسريرية للمرضى مفهومة أو موضحة جيدًا ، فقد تكون عرضة للتحيز.لحسن الحظ ، فإن ظهور أساليب الذكاء الاصطناعي القابلة للتفسير (XAI) يسمح للمشاركين - المرضى ومديري الرعاية الصحية وشركات التأمين - باكتساب مزيد من التبصر في المنطق وراء ذلك.
predictions, consequently promoting transparency and acceptability. As a result, predicting medical insurance costs with high certainty would solve problems such as accountability and transparency, enabling control over all parties involved in patient care (Panay et al., 2019). أعد المحاولة    سبب الخطأ

2. Research significance أعد المحاولة    سبب الخطأ

The contributions of this study are as follows: أعد المحاولة    سبب الخطأ
(i). Predicting medical insurance costs using ensemble learningbased machine learning models (XGBoost, GBM, and RF). أعد المحاولة    سبب الخطأ
(ii). Comparing the performance outcome of the algorithms deployed via various evaluation metrics. أعد المحاولة    سبب الخطأ
(iii). Explaining the BlackBox models using XAi methods and interpreting the determinants that influence prediction outcomes. أعد المحاولة    سبب الخطأ
(iv). Comparing the outcome of both XAi methods in explaining the black-box models أعد المحاولة    سبب الخطأ
The rest of the paper is structured as follows: the concept of medical insurance and related works are discussed in Section 2. Section 3 describes the methodology and approaches taken. Section 4 contains the experimental outcomes and the result of the determinant analysis. Finally, Section 5 summarizes the findings and provides recommendations for future work. أعد المحاولة    سبب الخطأ

3. Literature review أعد المحاولة    سبب الخطأ

3.1. Concept of medical insurance and its benefits أعد المحاولة    سبب الخطأ

Generally, health insurance is a pre-payment and risk-pooling mechanism designed to cover medical expenses incurred due to an illness. These expenses include hospitalizations, medicines, and doctor’s visits. Social and national health insurance has now made it possible to improve equitable access to health care and protect people from financial risks associated with diseases (ISSA, 2021). أعد المحاولة    سبب الخطأ
For most health insurance systems available today, there are two main financing arrangements: أعد المحاولة    سبب الخطأ
  1. The single health insurance pool (single-payer) أعد المحاولة    سبب الخطأ
  2. The multiple health insurance pool (multiple-payer) أعد المحاولة    سبب الخطأ
Also, within both financing arrangements, there exist many variations. The single-payer option generally includes greater government control over the provision of care and tends to emphasize equity. While the multi-payer option allows consumers to choose from the insurance companies available and this approach has been shown to drive innovation and competition (ISSA, 2021). In many countries, a combination of both single and multi-payer insurance is obtainable. أعد المحاولة    سبب الخطأ

3.1.1. Major types of health insurance systems أعد المحاولة    سبب الخطأ

There are about three major types of health insurance systems representing specific combinations:
هناك حوالي ثلاثة أنواع رئيسية من أنظمة التأمين الصحي التي تمثل مجموعات محددة:
  • Health Maintenance Organisation (HMO): In this plan, a list of doctors working directly with the HMO or on contract is provided for the insureds to pick as primary care physicians.
    منظمة الحفاظ على الصحة (HMO): في هذه الخطة ، يتم توفير قائمة بالأطباء الذين يعملون مباشرة مع HMO أو بموجب عقد للمؤمن عليهم لاختيارهم كأطباء للرعاية الأولية.
  • Preferred Provider Organization (PPO): PPO plans work by providing a list of pre-approved contracted providers. The use of a 60 / 40 60 / 40 60//4060 / 40 split for reimbursement is common, which means the insurer pays 60 percent of the costs, and the insured covers the remaining 40 percent. أعد المحاولة    سبب الخطأ
  • High-Deductible Health Plan (HDHP) With a Health Savings Account (HSA): HDHPs work by getting the insured to operate a health savings account with the provider from where treatment costs are deducted on an agreed percentage and plan with likely lower monthly premiums. أعد المحاولة    سبب الخطأ
Additionally, most medical insurance companies compensate customers for their medical expenses in two ways (Maheshwari, 2023) and (Kagan, 2023): أعد المحاولة    سبب الخطأ

3.1.2. Benefits of medical insurance coverage أعد المحاولة    سبب الخطأ

The following are some benefits of medical insurance for customers and healthcare managers: أعد المحاولة    سبب الخطأ
  • Coverage against critical illness - some diseases can be prolonged and fatal in nature, like renal failure, heart ailments, and cancer. For these types of illnesses, their plans operate differently with regard to making payments for benefits. However, with the right insurance plan these illnesses will be covered for the customer, thus guaranteeing the needed care is received.
    التغطية ضد الأمراض الحرجة - يمكن أن تكون بعض الأمراض طويلة ومميتة بطبيعتها ، مثل الفشل الكلوي وأمراض القلب والسرطان.بالنسبة لهذه الأنواع من الأمراض ، تعمل خططهم بشكل مختلف فيما يتعلق بدفع المدفوعات مقابل الاستحقاقات.ومع ذلك ، مع خطة التأمين المناسبة ، سيتم تغطية هذه الأمراض للعميل ، وبالتالي ضمان تلقي الرعاية اللازمة.
  • Safety against rising medical costs - just like with most economic sectors, the healthcare industry is experiencing an economic downturn with incessant rising costs. Directly paying money for healthcare can be extremely expensive. Under these circumstances, health insurance has the advantage. When an individual considers the medical insurance policy in a financial plan, it can reduce the trouble. The safety assurance against rising healthcare charges is a remarkable benefit of medical insurance.
    السلامة ضد ارتفاع التكاليف الطبية - تمامًا كما هو الحال مع معظم القطاعات الاقتصادية ، تشهد صناعة الرعاية الصحية انكماشًا اقتصاديًا مع ارتفاع التكاليف المستمرة.دفع المال مباشرة للرعاية الصحية يمكن أن يكون مكلفًا للغاية.في ظل هذه الظروف ، يتمتع التأمين الصحي بالميزة.عندما يفكر الفرد في بوليصة التأمين الطبي في خطة مالية ، يمكن أن يقلل ذلك من المشكلة.ضمان السلامة ضد ارتفاع رسوم الرعاية الصحية هو فائدة ملحوظة من التأمين الطبي.
  • Insurance coverage for healthcare emergencies - health emergencies are unpredictable and can occur at random. With a good medical insurance policy, one need not worry about the expenses, but rather concentrate and full recovery from the illness.
    التغطية التأمينية لحالات الطوارئ الصحية - حالات الطوارئ الصحية لا يمكن التنبؤ بها ويمكن أن تحدث بشكل عشوائي.مع وجود بوليصة تأمين طبي جيدة ، لا داعي للقلق بشأن النفقات ، بل التركيز والتعافي التام من المرض.
  • Improvements in medical technology and capacity - according to a study by Weisbrod (1991), the expansion of health insurance coverage over the years has created incentives to develop new medical technologies. This was corroborated by (Clemens & Olsen, 2021), who demonstrated that 20 to 30 percent of medical equipment and device innovation between 1965 and 1990 could be attributed to Medicare/Medicaid’s introduction in 1965. Furthermore, Frankovic & Kuhn (2023) conducted an expansive macroeconomic analysis of how health insurance influenced medical progress in the US from 1965 to 2005, considering its direct impact on lowering out-of-pocket costs as well. The results showed that insurance expansion accounts for approximately 63 percent of the growth in healthcare expenditure between 1965 and 2005, further stimulating medical R&D with an additional 57 percent.
    التحسينات في التكنولوجيا والقدرات الطبية - وفقًا لدراسة أجراها Weisbrod (1991) ، فإن التوسع في تغطية التأمين الصحي على مر السنين قد خلق حوافز لتطوير تقنيات طبية جديدة.وقد أكد ذلك (كليمنس وأولسن ، 2021) ، الذي أظهر أن 20 إلى 30 في المائة من ابتكار المعدات الطبية والأجهزة بين عامي 1965 و 1990 يمكن أن يعزى إلى إدخال Medicare / Medicaid في عام 1965.وعلاوة على ذلك، أجرى فرانكوفيتش وكوهن (2023) تحليلاً واسعاً للاقتصاد الكلي لكيفية تأثير التأمين الصحي على التقدم الطبي في الولايات المتحدة من 1965 إلى 2005، مع الأخذ في الاعتبار تأثيره المباشر على خفض التكاليف من الجيب أيضاً.وأظهرت النتائج أن التوسع في مجال التأمين يمثل ما يقرب من 63 في المائة من النمو في الإنفاق على الرعاية الصحية بين عامي 1965 و 2005 ، مما زاد من تحفيز البحث والتطوير الطبي بنسبة 57 في المائة إضافية.

3.1.3. Challenges of medical insurance
3.1.3.تحديات التأمين الصحي

Undeniably, all countries face major challenges in maintaining a sustainable healthcare system. Depending on the country, these challenges include issues such as the impact of aging populations, the rising chronic disease burden, health infrastructure development, and generally the financing of healthcare services. أعد المحاولة    سبب الخطأ
Using the US as a case study, the US per capita health expenditure was $ 7 , 960 $ 7 , 960 $7,960\$ 7,960 in 2009 (Publisher, 2016) but according to Statista, the 2021 figures stood at $ 10 , 202 $ 10 , 202 $10,202\$ 10,202 per resident (Statista, 2022). However, compared to other countries in the Organisation for Economic Co-operation and Development (OECD), the expenditure by the United States seems huge especially as the United States lags behind many of its peer nations in several indicators of health and health care quality (Nolte & McKee, 2008). أعد المحاولة    سبب الخطأ
So why is the US healthcare spending much higher? Research has traced this to two major issues namely: أعد المحاولة    سبب الخطأ
i. The United States has the highest administrative costs for health care in the industrial world, estimated at around $ 360 $ 360 $360\$ 360 billion a year, or 14 أعد المحاولة    سبب الخطأ
percent of all US healthcare expenses (Emmanuel, 2011). These costs are mainly due to the dominance of private insurance which necessitates heavy clerical and accounting demands that could have been more effectively managed with the implementation of electronic technologies (Boffey, 2012). أعد المحاولة    سبب الخطأ
ii. Second, private insurance in the United States is based on a fee-forservice model. Physicians, hospitals, healthcare professionals, and businesses can charge whatever they want for their services under this model. Compared to other industrial nations with lower prices, the United States has a fundamentally different healthcare system from its peer nations which helps explain why healthcare services are so much more expensive in the United States than in its peer nations (Klein, 2012). أعد المحاولة    سبب الخطأ
Conclusively, ML-driven health insurance has the capacity to bring about better outcomes and tackle some of the most formidable complications within the healthcare system, especially in America. As demands on consumers and providers increase and the sector struggles with a deficit of simplicity and technology, ML can provide a cheaper, more efficient solution. By gaining an insight into individual issues and specific healthcare needs, AI and ML-based approaches can organize data, while simultaneously finding innovative ways to simplify the industry along with improving patient safety and results.
بشكل قاطع ، فإن التأمين الصحي القائم على ML لديه القدرة على تحقيق نتائج أفضل ومعالجة بعض المضاعفات الأكثر هولاً داخل نظام الرعاية الصحية ، خاصة في أمريكا.ومع تزايد الطلب على المستهلكين ومقدمي الخدمات ويكافح القطاع مع عجز في البساطة والتكنولوجيا، يمكن أن يوفر ML حلاً أرخص وأكثر كفاءة.من خلال اكتساب نظرة ثاقبة على القضايا الفردية واحتياجات الرعاية الصحية المحددة ، يمكن للنهج القائمة على الذكاء الاصطناعي والنهج القائمة على ML تنظيم البيانات ، مع إيجاد طرق مبتكرة في الوقت نفسه لتبسيط الصناعة إلى جانب تحسين سلامة المرضى والنتائج.

3.2. Machine learning: A brief introduction أعد المحاولة    سبب الخطأ

Machine learning (ML) is a subset of Artificial intelligence (AI) that focuses on creating intelligent systems capable of autonomous learning from vast datasets. As emphasized by various studies (Carleo et al., 2019; Akter, 2020) while AI encompasses various technologies, including expert systems, deep learning, and robotics, ML specifically revolves around data-driven learning.
التعلم الآلي (ML) هو مجموعة فرعية من الذكاء الاصطناعي (AI) التي تركز على إنشاء أنظمة ذكية قادرة على التعلم الذاتي من مجموعات بيانات واسعة.وكما أكدت دراسات مختلفة (كارليو وآخرون،٢٠١٩ Akter ، 2020) في حين أن الذكاء الاصطناعي يشمل تقنيات مختلفة ، بما في ذلك أنظمة الخبراء والتعلم العميق والروبوتات ، فإن ML يدور على وجه التحديد حول التعلم القائم على البيانات.
According to authors (Adibimanesh et al., 2023; Fernández & Peters, 2023) the widespread adoption of ML techniques across various industries, can be attributed to advancements in ML techniques, the computational power of modern GPUs, and the availability of diverse datasets. Despite these achievements, it is noted that the full potential of AI and ML has yet to be realized, and there is ongoing research in this area (Panesar, 2019).
ووفقاً للمؤلفين (Adibimanesh et al. 2023؛ يمكن أن يعزى الاعتماد الواسع النطاق لتقنيات ML في مختلف الصناعات إلى التقدم في تقنيات ML ، والقوة الحسابية لوحدات معالجة الرسومات الحديثة ، وتوافر مجموعات بيانات متنوعة.على الرغم من هذه الإنجازات ، تجدر الإشارة إلى أن الإمكانات الكاملة للذكاء الاصطناعي و ML لم تتحقق بعد ، وهناك أبحاث مستمرة في هذا المجال (Pansar ، 2019).
ML tools and techniques help in decision-making through prediction and forecasting based on data. Generally, the more data an ML algorithm has, the better it performs (Ngiam & Khor, 2019), especially in medical-related applications, as described by Ray (2019).
تساعد أدوات وتقنيات ML في صنع القرار من خلال التنبؤ والتنبؤ القائم على البيانات.بشكل عام ، كلما زاد عدد البيانات التي تمتلكها خوارزمية ML ، كلما كان أداؤها أفضل (Ngiam & Khor ، 2019) ، خاصة في التطبيقات ذات الصلة بالطبية ، كما هو موضح من قبل Ray (2019).
The three categories of ML
الفئات الثلاث لـ ML
  1. Supervised Learning: supervised learning maps the association between inputs and outputs of a set of labeled training data (Qayyum, 2020). To demonstrate this phenomenon:
    التعلم الخاضع للإشراف: يرسم التعلم الخاضع للإشراف العلاقة بين المدخلات والمخرجات لمجموعة من بيانات التدريب المسمى (قيوم ، 2020).لإظهار هذه الظاهرة:
Imagine an n set of sample data { X μ , y μ } μ = 1 , . n X μ , y μ μ = 1 , . n {X_(mu),y_(mu)}_(mu=1,dots.n)\left\{X_{\mu}, y_{\mu}\right\}_{\mu=1, \ldots . n} we can denote one sample of the data as X μ R p X μ R p X_(mu)inR^(p)X_{\mu} \in \mathbb{R}^{p} with μ = 1 , , n μ = 1 , , n mu=1,dots,n\mu=1, \ldots, n where each X μ X μ X_(mu)X_{\mu} can be an image, and P P PP the number of pixels available in the image. Also, each X μ X μ X_(mu)X_{\mu} sample contains a label y μ R d y μ R d y_(mu)inR^(d)y_{\mu} \in \mathbb{R}^{d}, where d = 1 d = 1 d=1d=1. The label could contain an attribute of the image. The supervised learning technique tries to identify a function f f ff, which, on receiving an input X new X new  X_("new ")\mathrm{X}_{\text {new }} without a label, can accurately predict its output f ( X new ) f X new  f(X_("new "))f\left(\mathrm{X}_{\text {new }}\right). To evaluate the performance of this function f f ff, data samples available are typically separated into two sets - the training set used for developing the function and the test set for measuring how well it works. Linear and logistic regression, support vector machines (SVM), as well as ensemble approaches like random forest and XGBoost, are some of the famous methods employed in such tasks.
تخيل مجموعة n من بيانات العينة { X μ , y μ } μ = 1 , . n X μ , y μ μ = 1 , . n {X_(mu),y_(mu)}_(mu=1,dots.n)\left\{X_{\mu}, y_{\mu}\right\}_{\mu=1, \ldots . n} يمكننا الإشارة إلى عينة واحدة من البيانات على أنها X μ R p X μ R p X_(mu)inR^(p)X_{\mu} \in \mathbb{R}^{p} مع μ = 1 , , n μ = 1 , , n mu=1,dots,n\mu=1, \ldots, n حيث يمكن أن يكون كل X μ X μ X_(mu)X_{\mu} صورة ، و P P PP عدد البكسلات المتاحة في الصورة.أيضًا ، تحتوي كل عينة X μ X μ X_(mu)X_{\mu} على تسمية y μ R d y μ R d y_(mu)inR^(d)y_{\mu} \in \mathbb{R}^{d} ، حيث d = 1 d = 1 d=1d=1 .يمكن أن تحتوي العلامة على سمة من سمات الصورة.تحاول تقنية التعلم الخاضعة للإشراف تحديد وظيفة f f ff ، والتي ، عند تلقي مدخل X new X new  X_("new ")\mathrm{X}_{\text {new }} بدون تسمية ، يمكنها التنبؤ بدقة بمخرجاتها f ( X new ) f X new  f(X_("new "))f\left(\mathrm{X}_{\text {new }}\right) .لتقييم أداء هذه الوظيفة f f ff ، يتم فصل عينات البيانات المتاحة عادة إلى مجموعتين - مجموعة التدريب المستخدمة لتطوير الوظيفة ومجموعة الاختبار لقياس مدى نجاحها.الانحدار الخطي واللوجستي ، وآلات ناقلات الدعم (SVM) ، بالإضافة إلى نهج المجموعة مثل الغابات العشوائية و XGBost ، هي بعض الأساليب الشهيرة المستخدمة في مثل هذه المهام.

2. Unsupervised Learning: Unsupervised Machine Learning, unlike supervised ML, lacks predefined labels. It autonomously discovers patterns within data, making it effective for identifying hidden أعد المحاولة    سبب الخطأ
trends. Common applications include clustering with algorithms like K-Means and DBSCAN. أعد المحاولة    سبب الخطأ
3. Semi-supervised Learning: Semi-supervised Learning (SSL) combines labeled and unlabeled data for classification or clustering tasks (Van Engelen & Hoos, 2020). The authors (Zhu & Goldberg, 2009) identified SSL’s main category to include inductive SSL (predicting labels for unseen data) and transductive SSL (estimating labels for current unlabeled samples). SSL is applied in Speech Analysis, Protein sequence classification, and Text document classification (Fig. 1). أعد المحاولة    سبب الخطأ
Over the last ten years, health insurers have increasingly turned to AI and ML to identify people in need of greater protection and improve the insurance underwriting process. A system aiding consumers in purchasing health coverage must process data including hospital engagements, the ages of insureds, financial risk comfort level, degree of security, and many other variables. While ML is recognized for its dataintensive purposes, its biggest strength when handling a customer’s healthcare comes down to its capacity for proficient deduction and quick reading of trends (Pomales, 2022) أعد المحاولة    سبب الخطأ
Industry leaders are realizing that ML applications can help improve the accuracy of treatment protocols and health outcomes as more healthcare and medical companies adopt AI and ML in their varied systems. It’s essential to understand that the greater part of what is charged when buying health insurance goes into risk prediction and risk management and other overhead expenditures. By employing AI to build a system with more exact risk models, thereby determining which customers require specialized care, health insurers can allocate larger amounts towards their beneficiaries rather than these activities. Platforms incorporating data, refining evaluations, and producing intelligent observations can also significantly reduce the need for costly human analysts and other administrative costs.
يدرك قادة الصناعة أن تطبيقات ML يمكن أن تساعد في تحسين دقة بروتوكولات العلاج والنتائج الصحية حيث تتبنى المزيد من شركات الرعاية الصحية والطبية الذكاء الاصطناعي و ML في أنظمتها المتنوعة.من الضروري أن نفهم أن الجزء الأكبر مما يتم فرضه عند شراء التأمين الصحي يذهب إلى التنبؤ بالمخاطر وإدارة المخاطر وغيرها من النفقات العامة.من خلال توظيف الذكاء الاصطناعي لبناء نظام يحتوي على نماذج مخاطر أكثر دقة ، وبالتالي تحديد العملاء الذين يحتاجون إلى رعاية متخصصة ، يمكن لشركات التأمين الصحي تخصيص مبالغ أكبر للمستفيدين منها بدلاً من هذه الأنشطة.كما يمكن للمنصات التي تتضمن البيانات وصقل التقييمات وإنتاج الملاحظات الذكية أن تقلل بشكل كبير من الحاجة إلى محللين بشريين مكلفين وغيرهم من التكاليف الإدارية.
Much research has been done on using ML systems to forecast medical insurance costs, as indicated in (ul Hassan et al., 2021), where Linear Regression, Support Vector Regression, Ridge Regressor, Stochastic Gradient Boosting (SGB), XGBoost, Decision Tree, Random Forest Regressor, Multiple Linear Regression, and k-Nearest Neighbors were used. This study employed the medical insurance dataset obtained from KAGGLE. In the end, SGB had the highest accuracy at 86 % 86 % 86%86 \% with an RMSE of 0.340 .
تم إجراء الكثير من الأبحاث حول استخدام أنظمة ML للتنبؤ بتكاليف التأمين الطبي ، كما هو موضح في (ul Hassan et al. ،2021) ، حيث تم استخدام الانحدار الخطي ، الانحدار المتجه الدعم ، Ridge Regressor ، تعزيز التدرج العشوائي (SGB) ، XGBost ، شجرة القرار ، ريجريسور الغابات العشوائية ، الانحدار الخطي المتعدد ، و k-أقرب الجيران.استخدمت هذه الدراسة مجموعة بيانات التأمين الطبي التي تم الحصول عليها من KAGGL.في النهاية ، كان لدى SGB أعلى دقة في 86 % 86 % 86%86 \% مع RMSE من 0.340.
Medical insurance research has more recently focused on developing models to accurately predict High-cost Claimants (HiCCs). These people account for 9 % 9 % 9%9 \% of all healthcare costs in the US, as their annual costs exceed $ 250 , 000 $ 250 , 000 $250,000\$ 250,000. To this end, Maisog et al. (2019) conducted a study with 48 million individuals that incorporated health insurance claims and census data. Various ML models such as Random Forests, Support Vector Machines, Gradient Boosted Trees, Elastic Nets, and XGBoost were employed to calculate the individual risk of being a HiCC. Among them, LightGBM held the highest AUC-ROC score at 91.25 %, reiterating that claims data can produce high-performing predictive models. أعد المحاولة    سبب الخطأ
Duncan et al. (2016) utilized a dataset comprising 30,000 insureds from the USA that were received from health actuarial consultants Solucia Inc. (now SCIO Health Analytics) to construct ML models like the Linear model, Lasso, and Elastic Nets, Multivariate Adaptive Regression Splines (MARS), Random Forest, M5 Decision Trees, and Generalized Boosting Models to forecast future healthcare costs. The outcomes reflected that ML approaches are more appropriate for use in healthcare than the customary linear methods. M5, RF, and GBM emerged as the best-performing models among the Truncated R 2 R 2 R^(2)\mathrm{R}^{2}, Truncated MAE, and qMAD 0.95 qMAD 0.95 qMAD_(0.95)\mathrm{qMAD}_{0.95} metrics implemented.
استخ دم Dun can et al . (2016) مجموعة بيان ات تض م 30 ، 000 مؤ من عليه من الولايات المتحدة الأمريكية تم تل قي ها من الاست ش اري ين الا ك تو اري ين الصحي ين Sol uc cia Inc . (now SC IO Health Analytics) لب ناء نما ذ ج ML مثل الن مو ذ ج الخ طي ، L asso ، والش ب كات الم رن ة ، و Spl ines الان حد ار الت كي في متعدد المت غي رات (M AR S) ، و Rand om Forest ، و M 5 Dec ision Tre es ، ون ما ذ ج التع زيز الم عم مة للت ن ب ؤ بت كال يف الر عاية الصح ية المست قبل ية .ع ك ست الن ت ائج أن أس الي ب ML أكثر ملا ء مة للا ست خدام في الر عاية الصح ية من الط رق الخط ية الم عت ادة .ظ ه رت M 5 و RF و GB M ك أ فضل الن ما ذ ج أ داء ً بين مقا يي س Tr unc ated # 0 # و Tr unc ated MA E و # 1 # المن ف ذة .
The authors (Taloba et al., 2022) employed a business analytic method that incorporated statistical and ML approaches to determine
المؤ لف ون (تال وب ا وآ خر ون ،202 2) استخ دم ت طريقة تح ليل الأعمال التي تض منت النه ج الإ حص ائية و ML لت حد يد

    • Correspondent author.  ك اتب مرا سل .
    E-mail address: eaukwandu@cardiffmet.ac.uk (E. Ukwandu).
    عنوان الب ريد الإلكتر وني :eaukwandu@cardiffmet.ac.uk(ه ـ).أو ك وان دو).