Insight into the magnitude of muscle forces during movements is useful for several applications. It will, for example, help human movement researchers to understand how humans use their movement system, even under challenging conditions. It could also help explain clinicians and physiotherapists why the musculoskeletal system sometimes fails and can thus lead to improved diagnosis, treatment and perhaps even prevention of musculoskeletal disorders. In sports, where very small differences in musculoskeletal performance can cause a very large difference in outcome (winning or losing), insight into muscle forces can be used to develop training methods that optimise performance while not overloading the movement system.
Because it is very difficult to measure individual muscle forces in vivo, a more realistic approach than direct measurement is to deduce the magnitude of these forces from the mechanical effect that the coordinated action of muscles has on (more easily measurable) skeletal movements and forces on the environment. A musculoskeletal model applies mechanical principles to simulate the mechanics of the human movement system and to estimate muscle forces. This thesis focuses on large-scale musculoskeletal models of the upper extremity: models that describe the mechanical effect of all muscles and joints that are of direct influence on arm movements.
Large-scale upper extremity models were found to have been used for a variety of purposes (Chapter 2): to provide insight into general principles of human shoulder loading and movement, to analyse the effect of differences in executing a task on shoulder loading and – most frequently – to study the effect of pathological structures on shoulder function (for instance, to predict the effect of a tendon transfer). Although today’s most advanced largescale models aim to replicate most of the complex, three-dimensional interactions between multiple muscles and joints, these models have limited capacity to differentiate between subjects. One reason for this is that model parameters that describe the relevant aspects of anatomy (muscle contraction parameters, moment arms, skeletal dimensions, etc.) are typically based on limited cadaveric data (because in vivo measurement of all parameters is infeasible), while these differ between individuals.
Advancements in measurement techniques make the inclusion of subject-specific morphology in musculoskeletal models more realistic today. It is expected that subject-specific models can predict the functional consequences of inter-individual morphological differences to a level of detail that enables the predictions to be useful for, for example, the development of personalised treatments of muscle and joint diseases. Subject- or patient-specific modelling has therefore become a trending topic in biomechanics research, but has not yet led to new applications (Chapter 2). This thesis aimed to determine whether the costs to be spent for personalising modelling parameters are worth the effort, that is, whether it can be expected to lead to new, relevant applications. To achieve this main goal, methods were developed to personalise some of the modelling parameters used in the Delft Shoulder and Elbow Model (DSEM). Only in one study the improvement of subject-specific over generic model predictions could be determined, because the lack of an appropriate reference standard did not allow a direct validation in the other studies. However, the difference in predictions between model versions could always be determined, which provides insight into how large the effect of personalisation typically is. This information is used to speculate on the relevance of subject-specific models.
In Chapter 3, a new method to estimate the location of muscle attachments on the scapula (a bone with a complex geometry) based on four palpable bony landmarks was shown to predict the location with a 7.3 mm error, whereas this was 15.0 mm with a previously proposed method. The influence of errors in attachment location on muscle forces was evaluated with the DSEM for a shoulder abduction movement. Interestingly, a 10 mm change in attachment location of just one muscle (deltoid), resulted in 6% difference in muscle force predictions for all other muscles. This clearly demonstrates that a relatively small error on a single muscle parameter can affect the whole model. Also the effects of perturbations in other muscle parameters than attachment location were evaluated by, one at a time, changing a muscle’s optimum fibre length, tendon length, physiological cross-sectional area (PCSA) and muscle mass by +10% and -10% from its nominal value and calculating the change in force predictions. For this task, the effect of 10 mm error in attachment location was larger than 10% changes in any of the other parameters, which confirms the importance of accurate methods to determine muscle attachment sites.
The effect of scaling bone geometry on model simulated kinematics was studied in Chapter 4. Scaling thoracic, clavicular and scapular dimensions based on palpable bony landmarks reduced the difference between measured and simulated closed-chain shoulder kinematics by 34%. The effect of this kinematic improvement on muscle force predictions was not analysed because we did not know how to realistically scale other parameters such as muscle attachments and optimum fibre lengths. Leaving these parameters untouched would make the model’s morphology inconsistent and would therefore invalidate muscle force predictions. Another method to improve the kinematic match was developed as well: by allowing some small variation on kinematic constraints which are the result of the closed-chain structure of the shoulder girdle, a 42% improvement was obtained. For this method, the effect force predictions during arm elevation could be evaluated. Applying soft constraints changed some muscle force predictions to a maximum of 17%, but a much smaller effect on glenohumeral (GH) joint contact force (always less than 3% difference). Although both methods led to improvements in kinematics, only the soft-constraint-method can currently be used to predict muscle forces. Nevertheless, it is unlikely that the generally small effects will lead to different conclusions than the use of the default model.
Muscle volumes for five subjects were obtained by manually outlining muscle boundaries on MRI images of the subject’s shoulder (Chapter 5). The mass and PCSA of each muscle in the model was scaled based on these volumes and the effect on DSEM force predictions with both unscaled and the scaled model was evaluated for two tasks: isometric maximum force tasks and shoulder abduction (submaximal movement task). The PCSA-scaled model was better able to predict the maximum forces that the subjects could exert on a handle, evidenced by a reduction in inter-subject variation in maximum muscle stress from 37.6% with the default model to 13.5% with the scaled model. Interestingly, almost no difference was found between muscle-specific scaling and a simpler routine for which all muscles were scaled by the same factor. The model’s strength can most easily be scaled with a single factor, which can be derived from muscle volume data or, alternatively, from maximum force measurements. Individual muscle forces during an abduction movement were changed by 20-30% for some muscles as a result of PCSA scaling, but it could not be determined if this was an improvement. The GH joint force never changed more than 1.5% and it was concluded that the need for PCSA scaling, at least for submaximal tasks, debatable.
The measurability of two parameters which cannot be derived from anatomical MRI scans, fascicle length and pennation angle, was evaluated by comparing ultrasound to diffusion tensor imaging (DTI) reconstructions of the medial gastrocnemius fascicles (Chapter 6). There was little difference between fascicle length measurements of both methods (<3% difference). However, ultrasound measurements were imprecise: the mean absolute difference between any pair of measurements was 10 mm (20% of the mean length). Pennation angles were significantly different between ultrasound and DTI reconstructed fascicles, where the ultrasound pennation angles were on average 6° lower. Although the effects of these errors on muscle force predictions were not evaluated, the study provided insight into the feasibility of using ultrasound and DTI for personalising muscle architecture in musculoskeletal models. Ultrasound is relatively easy to apply, but fascicle length and pennation measurements are, at least for the medial gastrocnemius, imprecise (20% error). DTI allows for reconstructing muscle architecture to a level of detail that is not yet possible with any other non-invasive method. However, the low signal-to-noise ratio, substantial effort put into acquiring and post-processing the data and yet unknown applicability of the fascicle reconstruction method to shoulder muscles make it not yet feasible to implement it in musculoskeletal shoulder models.
In the last chapter, Chapter 7, it was concluded that in the foreseeable future the use of detailed methods to personalise large-scale upper extremity models will probably not lead to the new applications that form the incentive to develop such methods. Although insight into inter-individual differences in internal shoulder loading is relevant for several applications, it could not be shown that morphological differences form the most important source of these variations. Moreover, the effect of personalisation is small compared to the effect of other modelling assumptions (for example choice of load sharing criterion) and the difference between model predicted and directly measured GH joint forces from a previous study. New techniques have made the measurement of formerly less accessible parameters more feasible, but many parameters are still unmeasurable, or at least not in a way that is practically feasible. Also the impossibility to validate the predictions at an individual muscle force level make it very difficult to proof the superiority of subject-specific over generic model predictions. It can, however, reasonably be assumed that model predictions will improve even when only some parameters are personalised, provided that co-variation between parameters is taken into account such that a consistent dataset is obtained. Future research in subject-specific modelling should therefore focus on 1) scaling routines that capture the major sources of variation between subjects and are easy to implement and 2) further improvements in validation techniques.
Voor verschillende toepassingen kan inzicht in de grootte van spierkrachten nuttig zijn. Het kan bijvoorbeeld bewegingswetenschappers helpen te begrijpen hoe mensen hun bewegingsapparaat gebruiken, soms zelfs onder lastige omstandigheden. Ook kan het fysiotherapeuten en clinici helpen inzicht te krijgen waarom het bewegingsapparaat soms niet naar behoren werkt en kan zo leiden tot verbetering van diagnoses, behandelingen en wellicht zelfs voorkoming van aandoeningen aan het spierskeletsysteem. Maar ook in de sportpraktijk, waar zeer kleine verschillen in prestatie tot zeer grote verschillen in uitkomst (winnen of verliezen), kan inzicht in spierkrachten gebruikt worden om trainingsmethoden te ontwikkelen die prestatie optimaliseren maar het bewegingsapparaat niet overbelasten.
Omdat het erg moeilijk is individuele spierkrachten direct in vivo te meten, is het realistischer om de grootte van deze krachten af te schatten aan de hand van het mechanische effect dat het gecoördineerde samenspel van verschillende spieren hebben op (gemakkelijker meetbare) bewegingen van het skelet en krachten op de omgeving. Een spierskeletmodel past mechanische principes toe om de mechanica van het bewegingsapparaat te simuleren en spierkrachten te schatten. Dit proefschrift richt zich op grootschalige spierskeletmodellen van de bovenste extremiteit: modellen die het mechanische effect van alle spieren en gewrichten beschrijven die van directe invloed zijn op armbewegingen.
Grootschalige spierskeletmodellen van de bovenste extremiteit zijn voor verschillende toepassingen gebruikt (Hoofdstuk 2): om inzicht te krijgen in de algemene principes van krachten op en bewegingen van de schouder, om het effect van verschillende bewegingsuitvoeringen op schouderkrachten te analyseren en – voornamelijk – om het effect van pathologische structuren (afwijkingen) op schouderfunctie te bestuderen (bijvoorbeeld het effect van een peesverplaatsing). Hoewel de huidige meest geavanceerde modellen de complexe, driedimensionale interactie tussen meerdere spieren en gewrichten proberen te reproduceren, hebben de modellen een beperkte mogelijkheid om tussen verschillende mensen te differentiëren. Een van de redenen hiervoor is dat model parameters die de relevante anatomie beschrijven (spiercontractie parameters, moment armen, skelet afmetingen, etc.) normaal gesproken op kadavers worden gemeten omdat in vivo meting van alle parameters niet haalbaar is, terwijl deze natuurlijk uniek zijn per individu.
De vooruitgang in meettechnieken maken het vandaag de dag realistischer om persoon-specifieke kenmerken in modellen te verwerken. De verwachting is dat persoons-specifieke modellen de functionele gevolgen van interindividuele verschillen zo nauwkeurig kunnen voorspellen dat de modelvoorspellingen bruikbaar zijn om bijvoorbeeld op de persoon afgestemde behandelingen van spier- en gewrichtsaandoeningen te ontwikkelen. Een trend richting persoons- of patiënt-specifieke modellen is daarom zichtbaar in biomechanica onderzoek, maar heeft tot op heden niet tot nieuwe toepassingen geleid (Hoofdstuk 2). Dit proefschrift heeft als doel te bepalen of de kosten die gemaakt moeten worden om model parameters te personaliseren de moeite waard zijn, oftewel, of inderdaad verwacht kan worden dat het tot relevante nieuwe toepassingen zal leiden. Om dit hoofddoel te bereiken, zijn methoden ontwikkeld om enkele model parameters van het Delftse Schouder en Elleboog Model (DSEM) te individualiseren. Slechts in één studie kon de verbetering van modelvoorspellingen door het gebruik van gepersonaliseerde parameters gekwantificeerd worden, omdat in de andere studies het gebrek aan een goede referentie-standaard directe validatie in de weg stond. Desalniettemin kon het verschil in voorspellingen van verschillende modelversies wel bepaald worden, wat inzicht geeft over hoe groot het effect van personalisatie normaal gesproken is. Deze informatie is gebruikt om te speculeren over de relevantie van persoons-specifieke modellen.
In Hoofdstuk 3 werd aangetoond dat een nieuwe methode om op basis van vier palpeerbare botpunten de locatie van spieraanhechtingen op de scapula (een botstuk met een complexe geometrie) te bepalen, gemiddeld een fout van 7.3 mm opleverde, terwijl een eerder voorgestelde methode tot 15.0 mm afwijking leidde. Het effect van fouten in aanhechtingspunten op spierkrachtvoorspellingen was berekend met het DSEM voor een schouderabductie beweging. Een opvallende bevinding was dat een 10 mm verandering in aanhechtingspunt van een enkele spier (de deltoideus) leidde tot 6% verschil in spierkrachtschattingen van alle andere spieren. Dit toont duidelijk aan dat een relatief kleine fout in een enkele spier van invloed is op het gehele model. Ook het effect van afwijkingen in andere spierparameters was geëvalueerd door één voor één de optimale vezellengte, peeslengte, physiologische dwarsdoorsnede (PCSA) en spiermassa met +10% of -10% te variëren ten opzichte van de nominale waarde en het verschil in krachtvoorspelling te berekenen. Voor deze taak werden krachtvoorspellingen meer beinvloed door 10 mm veranderingen in spieraanhechtingen dan in 10% variaties in andere parameters, wat de relevantie van nauwkeurige bepaling van spieraanhechtingspunten bevestigt.
Het effect van het schalen van botgeometrie op de door het model gesimuleerde kinematica was bestudeerd in Hoofdstuk 4. Het schalen van thoracale, claviculaire en scapulaire afmetingen op basis van palpeerbare botpunten verkleinde het verschil tussen gemeten en gesimuleerde gesloten-keten kinematica van de schouder met 34%. Het effect van deze verbeterde kinematica kon niet geanalyseerd worden, omdat het nog onbekend is hoe andere parameters zoals botaanhechtingen en optimale spiervezellengtes mee schalen met botten. Het niet aanpassen van deze waarden zou de morfologie inconsistent maken en spierkrachtvoorspellingen onbetrouwbaar maken. Ook een andere methode om de kinematica beter op het model te passen was ontwikkeld: door enige vrijheid toe te laten op kinematische beperkingen (‘soft constraints’) die het gevolg zijn van de gesloten-keten-structuur van de schoudergordel werd een 42% verbetering bewerkstelligd. Voor deze methode kon het effect op spierkrachtvoorspellingen tijdens arm elevatie wel bepaald worden: het toepassen van ‘soft constraints’ leidde tot maximaal 17% verandering in spierkrachtvoorspellingen, maar een veel kleiner effect op glenohumerale (GH) gewrichtskracht (altijd minder dan 3% verschil). Hoewel beide methoden de kinematica dus verbeteren kan momenteel alleen de ‘soft constraint’-methode gebruikt worden om spierkrachten te voorspellen. Het is echter niet aannemelijk dat de kleine verschillen in krachtsvoorspellingen tot andere conclusies zullen leiden dan als een algemeen model gebruikt wordt.
Spiervolumes van vijf proefpersonen werden verkregen door spiercontouren in te tekenen op MRI scans van de schouders (Hoofdstuk 5). De massa en PCSA van iedere spier in het model werd geschaald op basis van deze volumes. Het effect op DSEM krachtsvoorspellingen van zowel het geschaalde als het ongeschaalde model werd bepaald voor twee taken: een isometrische maximale krachttaak en een schouderabductie taak (submaximale bewegingstaak). Het PCSA-geschaalde model kon beter de maximale kracht die de proefpersonen op een handvat konden uitoefenen schatten, aangetoond door een verlaging van de inter-individuele variatie in maximale spierspanning van 37.6% met het ongeschaalde model naar 13.% met het geschaalde model. Opvallend genoeg was er bijna geen verschil tussen een spier-specifieke geschaald model en een eenvoudigere schalingsmethode waar alle spieren door dezelfde factor geschaald werden. Modelsterkte kan het meest makkelijk geschaald kan worden door middel van een factor die zowel aan de hand van spiervolumes of van maximale krachten bepaald kan worden. Sommige individuele spierkrachten tijdens een abductietaak veranderden met 20-30% als gevolg van schalen, maar er kon niet bepaald worden of dit inderdaad een verbetering was. De GH gewrichtskracht veranderde nooit meer dan 1.5% door schaling en de conclusie was dat de noodzaak van PCSA schaling, zeker voor submaximale taken, discutabel is.
De meetbaarheid van twee parameters die niet met anatomische MRI scans bepaald kunnen worden, vezellengte en pennatiehoek, was geëvalueerd door reconstructies van vezels op basis van ultrasound-beelden en diffusion tensor imaging (DTI) scans van de mediale gastrocnemius met elkaar te vergelijken (Hoofdstuk 6). Er zat weinig verschil in vezellengtemetingen tussen beide methoden (<3% verschil), maar ultrasound metingen waren niet erg precies: het gemiddelde absolute verschil tussen gepaarde metingen was 10 mm (20% van de gemiddelde lengte). Pennatiehoeken waren significant verschillend tussen ultrasound en DTI gereconstrueerde vezels; ultrasound pennatiehoeken waren gemiddeld 6° kleiner. Hoewel het effect van deze fouten op spierkrachtvoorspellingen niet bepaald kon worden, bood deze studie inzicht in de haalbaarheid om ultrasound en DTI te gebruiken om spierarchitectuur te personaliseren in spierskeletmodellen. Ultrasound is relatief eenvoudig toe te passen, maar vezellengte- en pennatiehoek-metingen zijn, in ieder geval voor de mediale gastrocnemius, niet precies (20% afwijking). DTI kan spierarchitectuur reconstrueren tot een detail dat nog niet met andere niet-invasieve methoden behaald kan worden. De lage signaal-ruisverhouding, de aanzienlijke moeite die gestopt moet worden in het verkrijgen en verwerken van de data en de nog niet bekende toepasbaarheid van de spiervezelreconstructie-methode op schouderspieren staan de toepassing van DTI in spierskeletmodellering voorlopig nog in de weg.
In het laatste hoofdstuk (Hoofdstuk 7), werd geconcludeerd dat het gebruik van gedetailleerde methoden om grootschalige spierskeletmodellen van de bovenste extremiteit te personaliseren, waarschijnlijk in de nabije toekomst niet leidt tot de toepassingen die de aanleiding vormen tot het ontwikkelen van die methoden. Hoewel inzicht in interindividuele verschillen in interne schouderkrachten relevant is voor meerdere toepassingen, kon niet worden aangetoond dat morfologische verschillen de meest belangrijke bron van de variatie vormen. Bovendien is het effect van personalisatie klein ten opzichte van het effect van andere modelaannamen (bijvoorbeeld de keuze van kostfunctie in de spierkrachtverdeling optimalisatie) en het verschil tussen DSEM voorspelde en direct gemeten krachten uit een vorige studie. Nieuwe technieken hebben het meten van voorheen minder toegankelijke parameters haalbaarder gemaakt, maar veel parameters zijn nog steeds onmeetbaar, of tenminste niet op een praktisch toepasbare manier te meten. Ook de onmogelijkheid om voorspellingen te valideren op spierkrachtsniveau maken het aantonen van de superioriteit van persoons-specifieke modellen ten opzichte van generieke modellen zeer moeilijk. Het is echter aannemelijk dat zelfs als slechts enkele parameters geïndividualiseerd worden, modelvoorspellingen zullen verbeteren, als tenminste co-variatie tussen parameters in acht wordt genomen om consistentie tussen parameters te behouden. Vervolgonderzoek in persoons-specifiek modelleren zal zich daarom moeten richten op 1) schalingsmethoden die de belangrijkste bronnen van variatie tussen personen bevatten en eenvoudig te implementeren zijn en 2) verdere verbeteringen van validatietechnieken.